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1 . 


EVOLUTIA STATISTICII §1 
OBIECTUL El DE STUDIU 


1.1. Evolutia istorica a statisticii 

1.2. Rolul §i scopul statisticii 

1.3. Programe-software utilizate in statistica sociala §i psihologica 

1.4. Notiuni introductive privind utilizarea programului SPSS 

1.1. Evolutia istorica a statisticii 

Pe masura ce omenirea a evoluat, statistica s-a indepartat radical de statutul de 
„ramura a matematicii aplicate”, in zilele noastre, fiind considerate atat o §tiinta, o 
metoda de cunoa§tere a realitatii socio-economice, cat §i o discipline de invatamant. 
Evolutia ei a cunoscut numeroase modificeri, precizeri, transformeri in ceea ce 
prive§te obiectul ei de studiu dar §i din perspectiva instrumentelor, metodelor sale de 
cercetare. Ca §i alte §tiinte (matematica, de exemplu) §i aceaste discipline a parcurs 
drumul lung §i sinuos de la necesitatile 
practicii la elaborerile teoretice. 

Lucrari cu caracter statistic, impuse de 
nevoile conducerii treburilor publice, apar 
incd din antichitate. In Egipt, Grecia §i 
Roma antice erau realizate recenseminte 
destinate evidentierii resurselor umane §i 
materiale ale statelor respective. Aceste 
preocupari insa, au fost considerate naive §i 
pre§tiintifice, adevdratul inteles al 
statisticii, acela de §tiinte, datand doar de la 
jurndtatea secolului al XVII-lea. 

Prima analizd statistice, in spirit 
§tiintific, a unor date culese in prealabil, 
este datorate lui John Graunt (1662) care, 
pe baza datelor extrase din in§tiinterile 
sdptemanale cu privire la mumml 
deceselor inregistrate la Londra, a izbutit sd 
tragd concluzii valabile asupra unor 
fenomene sociale, precum: natalitatea §i 
mortalitatea, echilibrul numeric §.a. Prin 
aceste preocupdri el este considerat 
„perintele” demografiei. 

In Anglia, aieturi de Graunt, titlul de 



John Graunt (1620 - 1674) 

comerciant englez, preocupat in timpul liber de 
„fenomenele demografice” din Londra, publica in 
1662 articolul Natural and Political Observations 
on the Bills of Mortality. Ideile sale au fost preluate 
de Sir William Petty §i de astronomul Edmond 
Halley §i apoi recunoscute de catre Societatea 
Regala Engleza 




„iiiventator” al statisticii i se atribuie §i lui William Petty (1623-1687), care 
introduce conceptul de „aritmetica politico ” definit ca studiul fenomenelor social- 
economice „prin intermediul cifrelor, al masurilor §i greutdtilor". 

Paralel cu aceste prime preocupari s-a creat, in Germania, un curent de gandire 
care i§i propunea sa descrie situatia diferitelor state constituite la acea vreme din 
punct de vedere al populatiei, bogatiilor, industriei, comertului §i fmantelor. Aceasta 
preocupare se apropie mai mult de sensul etimologic al cuvantului statistica: in 
limba latina ^status”, are sensul de „stare” sau „stat”. Astfel unii autori atribuie 
germanului Gottfried Achenwall (1719-1772) meritul de a fi intrebuintat pentru 
prima data termenul de statistica, dand intaietate §colii descriptive germane. Spre 
deosebire de §coala engleza a aritmeticii politice, care punea accentul pe colectarea 
cifrelor §i analiza lor, §coala descriptiva germana era orientata spre alcatuirea de 
monografii §i spre compararea calitativa a resurselor statelor. 

Recunoscand meritul ambelor curente de gandire, T. Rotariu (1999, p. 15) 
considera ca „$tiinta statistici, a§a cum arata ea astazi, datoreaza aproape totul 
§colii engleze, insa contributia universitara germana nu poate fi neglijata chiar §i 
numai pentru motivul ca respectivei §coli ii datoram numele acestei gtiinte”. 

In spiritul acestei §coli descriptive, au fost elaborate §i in tarile romane in 
secolele XVIII §i XIX o serie de lucrari ce au contribuit la dezvoltarea statisticii. 
Prima §i cea mai reprezentativa lucrare de acest gen este ,,Descriptio Moldavia e” 
(1716) a lui Dimitrie Cantemir (1673-1723), o monografie cu caracter geografic, 
politic, economic, social §i cultural, care il impune pe autorul ei printre frunta§ii 

statisticii descriptive europene (D. 
Porojan, 1993). §i alti cronicari precum 
Grigore Ureche sau Ion Neculce au avut 
preocupari asemanatoare, iar in 1859, 
sub domnia lui Alexandru loan Cuza, se 
infiinteze primul Birou de Statistica al 
Tarii Romane§ti, condus de Dionisie 
Pop Martian (Popescu, 2000) 

Revenind la inceputurile statistici, 
reamintim faptul ca §coala descriptiva 
germana era orientata spre descrierea 
verbala a caracteristicilor statelor, in 
timp ce aritmetica politica a fost 
orientata spre analiza fenomenelor 
sociale §i cautarea legitatilor respective 
pe baza datelor §i calculelor numerice. 
Ambele curente au fost depa§ite de 
progresele realizate in domeniul 
matematicii, in general §i al calculului 
probabilitatilor, in special. De altfel, 
dezvoltarea teoriei probabilitatilor a 
constituit un pas-inainte nu numai pentru statistica, ci §i pentru intreaga creatie 
intelectuala a omenirii. 



Karl Friedrich Gauss (1777 - 1855 ) 

astronom, matematician §i fizician german. A facut 
descoperiri importante in materie de mecanica celesta, 
electromagnetism, optica. A dezvoltat teoria numerelor. 
A pus premisele geometriei hiperbolice noneuclidiene 
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Inca din secolul al XVII-lea s-a observat ca masuratorile repetate ale unui obiect 
oarecare pot fi reprezentate grafic sub forma unei curbe in forma de clopot. Ecuatia 
curbei normale a fost publicata in 1733 de catre Abraham de Moivre iar lucrarile 
acestuia au fost dezvoltate ulterior de Pierre Simon de Laplace §i Karl Friedrich 
Gauss. In zilele noastre curba normala poarta numele savantului german: 
clopotul/curba lui Gauss. 



Exemptu : Calificativele obtinute in urma examenului de statistica de 110 studenti, 

ale§i aleator. 

Odata cu progresele facute in culegerea datelor §i cu cre§terea interesului fata de 
observatia §i masuratorile §tiintifice, statistica a devenit un instrument indispensabil 
pentru toate §tiintele sociale. Un nume de referinta este cel al francezului Frederic 
Le Play (1806-1870). Acesta este recunoscut prin „introducerea in analiza 
sociologies a mijloacelor cantitative” (Rotariu et.al., 1999, p. 15). Insa, cea mai mare 
contribute in aceasta directie o are belgianul Adolphe Quetelet (1796-1874), care, 
la inceputul secolului al XlX-lea, aplica teoria probabilitatilor la studiul fenomenelor 
sociale, introducand conceptul de statistica morala ”. Sub initiativa sa s-a organizat 
in 1853 primul Congres International de Statistica, la care s-a constituit Institutul 
International de Statistica. 

Adevaratul inceput al statisticii modeme poate fi fixat la inceputul secolului al 
XX-lea odata cu aparitia lucrarilor lui Karl Pearson (creatorul statisticii inferentiale 
sau inductive) §i Ronald Aylmer Fisher (a elaborat teoria riguroasa a tragerilor 
concluziilor din datele observate). Alte nume de referinta in fundamentarea statisticii 
sociale sunt: C.E. Spearman, G.U. Yule, M.G. Kendall, A.A. Markov 
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1.2. OBIECTUL DE STUDIU §1 ROLUL STATISTICII 

In dezvoltarea sa statistica s-a preocupat de acele fenomene §i procese care se 
produc intr-un numar mare de cazuri, denumite fenomene colective (de masa) sau, 
daca ne referim strict la §tiintele sociale, fenomene sociale de masa. Aceste 
fenomene de masa se afla sub incidenta legii numerelor mari 1 potrivit careia 
variatiile intamplatoare de la tendinta generala se compenseaza reciproc intr-un 
numar mare de cazuri individual. 

Aplicarea metodelor statisticii in vederea interpretarii datelor oferite de 
observarea fenomenelor de masa permite formularea unor legi statistice. Acestea 
exprima media starilor unei mase de evenimente, tendinta dominanta care-§i face loc 
printr-un mare numar de abateri intamplatoare de la aceasta medie. Legea statistica 
poate fi evidential numai daca este supusa observarii unui numar suficient de mare 
de elemente ale ansamblului de studiat (legea numerelor mari). 

In concluzie, statistica studiaza aspectele cantitative ale fenomenelor de masa, 
fenomene care sunt supuse actiunii legilor statistice §i care se manifests in conditii 
concrete, variabile in timp §i spatiu. 

Incercand o defmitie sintetica, putem afirma ca statistica reprezinta un 

ansamblu de metode si tehnici utilizate pentru a colecta, a descrie si a analiza 
date obtinute in urma unor investigate §tiintifice. 

Statistica a patruns in toate domeniile §tiintelor naturii §i ale §tiintelor sociale, 
formand discipline de granita precum statistica matematica, statistica economica, 
statistica sociala, statistica psihologica, statistica medicala, biostatistica etc. Dintre 
acestea, a§a-zisa statistica sociala §i/sau psihologica se suprapune mult timp §i in 
mare masura peste statistica teoretica generala, propunandu-§i sa culeaga, prelucreze 
§i sa inteipreteze informatiile numerice referitoare la fenomenele psihosociale 2 . 
Chiar daca vom folosi de multe ori termenul de statistica sociala (sau psihologica), 
nu consideram justificata pretentia unora de a considera statistica sociala ca o §tiinta 
de sine statatoare ci, mai degraba ca o discipline preocupata de a ilustra modul 
specific in care statistica generala se aplica in domeniul §tiintelor sociale §i 
comportamentale (vezi caseta 1.1.). 

Astfel, statistica reprezentand un corp de metode §tiintifice are rolul de a ne 
invata cum sa organizam observarea fenomenelor de masa §i sa obtinem datele 
necesare, cum sa prelucram aceste date §i cum sa formulam ipoteze cu privire la 
relatiile evidentiate de aceste date. De asemenea, statistica ofera metode pentru 
testarea ipotezelor §i pentru confruntarea realitatii cu predictiile formulate pe baza 
ipotezelor. 


1 Legea numerelor mari a fost formulata de J. Bernoulli in 1713, precizand ca intr-un numar 
suficient de mare de cazuri individuale, influentele factorilor se pot compensa in a§a fel 
incat sa se ajunga la o anumita valoare tipica pentm intreaga colectivitate. 

2 pentru mai mute informatii vezi Rotariu el. al., 1999, pp. 15-18. 
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in urma dezvoltarii istorice prezentate mai sus statistica modema s-a separat in 
doua parti distincte dar complementare: 

a) statistica descriptive, se refera la regulile observarii statistice directe §i 

la obtinerea informatiilor ce rezulta din prelucrarea 
datelor empirice. Aici sunt incluse mijloacele 
clasice ale statisticii: gruparea datelor, distributee 
de freevente, corelatia §i regresia, analiza relatiilor 
dinamice. 

b) statistica inductiva (inferenta statistica), se refera la organizarea 

observarii statistice indirecte, prin metode §i tehnici 
de estimare a insu§irilor unei populatii statistice din 
observatii efectuate asupra unei submultimi de 
unitati statistice, numita e§antion. Include aplicatii 
statistice ale teoriei probabilitatii. 


1.3. Programe-software utilizate in statistica social a §1 

PSIHOLOGICA 

Cele mai cunoscute programe utilizate de cercetatorii din psihologie, sociologie, 
asistenta sociala, economie, pedagogie etc. atunci cand realizeaza analize §tiintifice 
§i prelucrari statistice complexe sunt: SPSS, SYSTAT, STATISTICA, MINITAB, 
SuperLab §.a. Vom descrie pe scurt doua din aceste software-uri §i vom prezenta 
notiunile de baza necesare utilizarii unuia dintre ele (SPSS). 


1.4. Notiuni introductive privind utilizarea programului 

SPSS 

in capitolele aplicative ne vom referi la programul SPSS versiunea 11.0 sub 
sistemul de operare Windows. 3 Aceste capitole se vor a constitui un ghid de laborator 
care sa-1 orienteze §i indrume pe utilizator in dorinta acestuia de a-§i insu§i procedurile 
§i tehnicile oferite de programul SPSS pentru prelucrarea statistica a datelor. 

Deschiderea programului 

Pentru pomirea unei sesiuni de lucru in SPSS exista urmatoarele posibilitati: 

> Daca pe desktop se afla shortcut-ul (icon-ul) SPSS se pozitioneaza cursorul 
pe respectivul icon §i se tasteaza dublu-clik pe butonul stanga al mouse-ului. 


3 Unele dintre informatiile prezentate nu sunt integrate in versiunile mai vechi (de exemplu, 
versiunea 7.0) §i sunt diferite sub alte sisteme de operare sau pentru sistemele Macintosh. 
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L£) 

myX Desktop 


* 


My Computer Internet Explorer 


[£, 

SPSS 11.0 for 
Windows 



HP Photo & Imaging 


Dublu-clik pe 
butonul stanga 
al mouse-ului 


> Dupa ce sistemul de operare Windows a fost incarcat, se apasa o singura 
data pe butonul stanga al mouse-ului pe urmatorul traseu: 

Start - Programs - SPSS for Windows - SPSS 11.0 for Windows 

Dupa deschiderea programului SPSS, pe ecran va aparea o fereastra de 
intampinare. Este de fapt o fereastra de date (Data View) din cadrul editorului de 
date (SPSS Data Editor), fara titlu - denumita totu§i „ Untitled ’ - §i, atentie!, fara sa 
fie salvata in memoria calculatorului. 

> O a treia posibilitate de deschidere a SPSS-ului o reprezinta accesarea (prin 
dublu-clik) a oricarui fi§ier acceptat de program. 

Exemple: bazele de date in SPSS sunt fi§iere cu extensia *.sav; 
fi§ierele de tip „syntax” au extensia *.sps; 
fi§ierele de tip „output” au extensia *.spo etc. 


Ferestrele in SPSS 

SPSS folose§te mai multe tipuri de ferestre, fiecareia dintre ele fiindu-i asociat 
un anumit tip de fi§ier. lata cele mai importante dintre ele: 

> Fereastra de editare a datelor (Date Editor) se deschide implicit la lansa- 
rea unui fi§ier de tip baza de date, fi§ier care in SPSS are extensia *.sav. In 
aceasta fereastra sunt introduse §i a fixate datele de lucru sub forma unui 
tabel in care liniile reprezinta cazurile (subiectii) iar coloanele variabilele 
cercetarii. 

Fereastra de editare este, la randul ei, compusa din doua foi (ferestre): 

- fereastra de date (Data View), folosita pentru introducerea §i vizualizarea 

seriilor statistice simple (a datelor brute) - vezi figura 1.1. 

- fereastra de gestionare a variabilelor (Variable View), folosita pentru 

defmirea §i modificarea variabilelor - vezi figura 1.2. 

Accesarea uneia dintre aceste doua ferestre se realizeaza prin actionarea 
icon-ului corespunzator din partea stanga-jos a ferestrei de intampinare. 
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Bara 
de titlu 





Fereastra pentru 
introducerea datelor 
(Editor de celule) 


: ] Untitled - SPSS Data Editor 



Figura 1.1. Fereastra de mtampinare a programului SPSS 


> Fereastra de gestionare a rezultatelor sau Fereastra de ie§ire (Output - 
SPSS Viewer), folosita pentru afi§area §i editarea rezultatelor prelucrarilor 
statistice (tabele, grafice, indicatori statistici) - vezi figura 1.3. Fereastra 
Output Viewer este structural in doua cadrane sau zone: 

• cadranul din stanga - cuprinsul - prezinta sub forma unei schite 
obiectele continute in fereastra §i 

• cadranul/zona din dreapta - continutul - in care sunt afi§ate 
rezultatele obtinute prin respectiva analiza. 

Pentru aparitia acestei ferestre intalnim urmatoarele situatii: 

SPPS deschide automat aceasta fereastra atunci cand este solicitat sa 
faca prelucrari §i analize statistice (Atentie: fi§ierul astfel format va avea 
denumirea OUTPUTx §i nu este salvat in memoria calculatorului; 
pentru aceasta trebuie parcurs traseul File - Save sau File - SaveAs); 
este deschisa de catre utilizator prin accesarea unuia dintre fi§ierele cu 
extensia *.spo salvate anterior in memoria calculatorului. 
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Figura 1.2. Fereastra de gestionare a variabilelor 



Figura 1.3. Fereastra de gestionare a rezultatelor 

> Fereastra de editare a comenzilor (Syntax Editor) permite scrierea 
comenzilor de catre utilizator §i salvarea acestora intr-un fi§ier de tip sintaxa 
cu extensia *.sps. Variantele recente ale SPSS contin meniuri pull-down §i 
casete de dialog care permit lansarea comenzilor fara a scrie sintaxa acestora. 
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NOTIUNI FUNDAMENTALS FOLOSITE 
IN STATISTIC! 


2.1. Colectivitatea §i unitatea statistica. 

2.2. Variabile statistice. 

2.3. Cunatificarea §i masurarea fenomenelor psihosociale. 

2.4. Scale de masura. 

2.5. Defmirea variabilelor statistice cu ajutorul SPSS. 


Statistica aplicata in §tiintclc sociale are la baza principiile, tehnicile §i metodele 
avansate de statistica teoretica generala. Aceasta din urma, folose§te un numar mare 
de notiuni §i concepte, cu caracter general, care formeaza vocabularul de baza al 
statisticii. 

In statistica sociala, s-au incetatenit de-a lungul timpului, urmatoarele concepte 
fundamental: 

• Colectivitatea (populatia) statistic! - reprezinta totalitatea 

elementelor simple sau complexe supuse studiului statistic. ( exemple : elevii 
unei §coli, populatia unui ora§) 

• Unitatea statistic! (individul statistic) - reprezinta elementele 

componente (constitutive) ale colectivitatilor statistice. Ele pot fi: 

- simple ( exemple : elevul, studentul, muncitorul); 

- complexe, acestea sunt rezultatul organizarii sociale §i economice a 
colectivitatii ( exemple : familia, echipa, clasa de elevi, grupa de studenti). 

• Caracteristica (VARIABILA) statistic! - reprezinta insu§irile sau 

trasaturile ce defmesc §i delimiteaza unitatile statistice ( exemple : varsta, 
notele §colare) 

• VALOAREA (VARIANTA), notata cu x, y ... - reprezinta forma concreta de 

manifestare a caracteristicilor la nivelul fiecarei unitati statistice ( exemple : 
18 ani, nota 7). 

• FRECVENTA ABSOLUT!, notata cu /„ f y ... - reprezinta numarul de unitati la 

care se inregistreaza aceea§i varianta ( exemple : 12 elevii au 18 ani, 3 
studenti au obtinut nota 7). 

• FRECVENTA RELATIv! (PONDEREA), notata cu / rx , fry ••• - se obtine prin 

ponderarea frecventei absolute, altfel spus, reprezinta procentul unei 
frccvcntc absolute din totalul frecventelor. (exemplu: din 48 de elevii ai unei 
clase 12 au varsta de 18 ani, deci ponderea acestora este de 25%) 

• INDICATORII STATISTICI - reprezinta expresia numerica a unor determinari 

obiective ce rezulta dintr-o cercetare statistica ( exemple : media, mediana, 
abaterea standard). 



2.1. COLECTIVITATEA (POPULATIA) §1 UNITATEA STATISTIC! 

Dupa cum am specificat in primul capitol (vezi subcapitolul 1.2.) statistica este 
preocupata de studierea fenomenelor de masa, a acelor ansambluri finite de elemente 
care sunt, in mod esential, de aceea§i natura calitativa, apartin aceluia§i teritoriu §i 
aceluia§i timp, altfel spus, sunt statistic omogene. (Jaba & Grama, 2004) Aceste 
ansambluri sunt cunoscute sub denumirea de colectivitati, popuiatii, multimi. 

COLECTIVITATEA STATISTICA (POPULATIA STATISTICA) - reprezinta 
totalitatea elementelor simple sau complexe supuse studiului statistic. 

In functie de natura elementelor componente, colectivitatile statistice pot fi 
formate din ansambluri de fiinte, de obiecte sau de evenimente 
Exemple : - elevii unei §coli, populatia unui ora§, 

- numerele unui anumit ziar aparute intr-o luna de zile, 

- accidentele rutiere comise pe raza unui judet, 

- opiniile electorale inregistrate intr-un sondaj. 

Dupa numarul elementelor componente, colectivitatile statistice pot fi totale sau 
partiale. Primele cuprind totalitatea elementelor componente, in timp ce colectivitatile 
partiale, cunoscute sub denumirea de E§ANTIOANE, cuprind un numar reprezentativ 
de unitati extrase dintr-o colectivitatea totala. Din acest punct de vedere intalnim 
cercetari exhaustive - in cazul populatiilor statistice totale - §i cercetari selective - 
ce folosesc proceduri de selectie a indivizilor ce vor inclu§i in e§antion. 

UNITATEA STATISTICA (individul statistic) - reprezinta elementele 
componente (constitutive) ale colectivitatilor statistice. Ele pot fi fiinte, lucruri, 
precum §i fapte, evenimente referitoare la acestea. 

Dupa gradul de complexitate se clasifica in: 

simple, formate dintr-un singur individ ( exemple : elevul, angajatul); 
complexe, acestea sunt rezultatul organizarii sociale §i economice a 
colectivitatii ( exemple : familia, clasa de elevi, grupa de studenti). 

De§i, atat termenul de individ cat §i cel de populatie statistica ne due cu gandul 
la natura umana a lucrurilor, exemplele de mai sus pot fi completate cu unitati 
statistice referitoare la lucruri (piesele unui lot supus controlului de calitate) sau la 
actiunea omului asupra lucrurilor (masurarea repetata a unui acela§i obiect, 
aruncarea zarului). 


2.2. Variabile statistice 

Variabilele statistice (caracteristicile statistice) - reprezinta 
insu§irile ce defmesc §i delimiteaza unitatile statistice. Ele exprima trasaturile 
esentiale purtate de unitatile statistice ale unei colectivitati, adica dimensiunile prin 
care se observa, se cuantifica, se masoara §i inregistreaza fiecare unitate din 
colectivitate. Populatiile umane, cele mai des intalnite in studiile psihosociale, pot fi 
caracterizate, de exemplu, prin urmatoarele variabile: sex, varsta, nivel de 
§colarizare, coeficient de inteligenta, tip temperamental §.a. 
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Valorile unei variabile statistice se mai numesc variante sau atribute ale 
variabilei §i se obtin prin actiuni concrete de cuantificare §i mSsurare a unitStilor 
unei colectivitSti statistice. De exemplu, variabila „mediul de provenienta ” are ca 
variante: urban §i rural, iar variabila „notele la examenul de statistic a' are ca valori 
numerele intregi de la / la 10. 

Caracteristicile statistice au proprietatea de a-§i modifica insu§irile in timp §i 
spatiu, de la o unitate la alta, in fiinctie de influentele exercitate de o multitudine de 
factori esentiali §i intamplStori care actioneazS la nivelul fiecSrei unitSti din colec- 
tivitate. AceastS proprietate da variabilelor statistice caracterul de variabila aleatorie. 

In practica de cercetare sunt luate in considerare numai acele variabile care 
prezintS cel putin douS valori. DacS, dupS o anumitS caracteristicS toate unitStile ar 
fi identice, aceasta nu ar mai necesita nici un fel de analizS, nemaifiind nevoie sS se 
investigheze cum se manifests indivizii statistici §i care sunt cauzele acestei variatii. 
Sa presupunem ca toti studentii ar obtine nota 10 la disciplina „statisticS socialS”; nu 
ar avea nici o relevantS sa verificam daca exists o legSturS intre aceste note §i 
mediile acelora§i studenti la examenul de bacalaureat! 

A§adar, cu cat o variabila imbraca forme mai diverse, cu atat ea capata o valoare 
de cunoa§tere mai mare. Numai diversitatea formelor de manifestare a unei insulin 
ii confera acesteia un interes din partea cercetatorului. (Rotariu et.al., 1999) 

• Dupa modul de exprimare, variabilele statistice se clasifica in: 

o variabile cantitative (sau numerice), exprimate prin numere stabilite 
prin numarare/masurare directa sau calcule ulterioare. Numarul stabilit 
este un numar cardinal ce reda intensitatea cu care se manifests 
insu§irea respectivS in cazul individului respectiv. 

La randul lor, variabilele cantitative se clasificS dupS natura variatiei in: 
variabile discrete, cu variatie discontinuS, care pot lua numai valori 
intregi, de regulS, pozitive. Exemple: numSrul de membrii din 
gospodSrie, numSrul cuvintelor memorate la o probS de memorie. 
variabile continue, cu variatie continuS, care pot lua orice valoare 
intr-un interval dat. Exemple : mediile §colare anuale, venitul lunar. 

o variabile calitative (numite §i variabile atributive, categoriale, 

nominale), sunt caracteristici ale cSror variante de manifestare sunt 
exprimate atributiv, prin cuvinte. Exemple : sexul, mediul de 
provenientS, tipul temperamental. 

Atragem atentia cS intr-un studiu statistic sunt retinute numai acele caracteristici 
care prezintS interes pentru cercetarea intreprinsS. Pot fi zeci, chiar sute de variabile 
ce pot caracteriza indivizii unei populatii statistice. De mult ori ne limitSm la a 
analiza doar cateva dintre ele. 

De asemenea, tot cercetStorul este cel care stabile§te, uneori, modul de exprimare 
§i/sau natura variatiei unei variabile. O variabilS cantitativS poate fi exprimatS 
calitativ, dupS cum §i o variabilS cantitativS continuS poate fi transformatS, prin 
rotunjire, intr-o variabilS discretS. Exemplul clasic in sustinerea observatiilor de mai 
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sus este cel al variabilei „varsta”: exprimata in ani-luni-zile reprezinta o variabila 
cantitativa continua, exprimata in ani impliniti este o variabila cantitativa discreta, 
iar atunci cand folosim categoriile tanar-adult-varstnic, avem o variabila calitativa. 

In fine, nu trebuie uitat faptul ca de foarte multe ori variantele sau atributele 
variabilelor calitative sunt codificate cu ajutorul numerelor. Aceste coduri reprezinta 
ni§te identificatori, acordarea lor fiind pur conventional!!, deci ele nu se supun 
operatiilor matematice sau prelucrarilor statistice bazate pe operatii matematice 
(Jaba & Grama, 2004). De exemplu, intrebarea „Va place cursul de statistic^ 
sociala?” poate fi codificata prin 0-NU §i 1-DA sau „Starea civila” poate fi 
codificata prin 1-necasatorit, 2-casatorit, 3-divortat, 4-vaduv, 5-alte variante; in 
ambele exemple ar fi inutila calcularea mediei, a abaterii standard sau a oricarui alt 
indicator rezultat in urma unor calcule matematice. 


2.3. CUANTIFICAREA §1 MASURAREA FENOMENELOR PSIHOSOCIALE 

De foarte multe ori in sfera §tiintelor sociale §i comportamentale rezultatele 
obtinute in urma unor demersuri empirice sunt exprimate calitativ. Partidul cu care a 
votat un alegator, tipul temperamental al unui manager sau calificativul obtinut de 
un elev de clasa I sunt exemple de exprimari calitative ale unor caracteristici. In 
toate aceste situatii vom putea utiliza aparatul statistic doar daca vom face apel la 
operative de cuantificare §i masurare. 

Conform Dictionarului de Sociologie «Zamfir & Vlasceanu (coord.), 1998, 
p.l45», cuantificarea reprezinta „operatia teoretica de descriere cantitativa a 
fenomenelor §iproceselor sociale in vederea mdsurarii p/sau evaluat'd acestora ...” 
In acela§i sens, Marginean (1982) face distinctie intre cuantificare, desfa§urata cu 
preponderenta la nivel teoretico-metodologic §i masurare, operatie preponderent 
empirica, prin care se determina modalitatea de manifestare a fenomenului respectiv 
§i prin care se atribuie valori numerice unor caracteristici §i dimensiuni ale 
fenomenelor studiate. 

Sintetizand o serie de consideratii referitoare la cele doua concepte, Ludu§an §i 
Voiculescu (1997) considera cunantificarea ca o operatie complexa, ce implied 
trecerea de la conceptele abstracte la dimensiuni §i indicatori cantitativi, care, 
ulterior, prin actiuni concrete sa fie inregistrati §i, eventual, masurati. Cunatificarea, 
sustin aceia§i autori, este o operatie prin care - pornindu-se de la analiza conceptelor 
§tiintifice, pe de o parte §i de la analiza naturii fenomenelor studiate, pe de alta parte 
- „sunt dezvaluite §i definite componentele, dimensiunile §i expresiile cantitative ale 
domeniului cercetat, astfel meat sa devina posibila colectarea, inregistrarea fi 
exprimarea cantitativa a datelor fi folosirea aparatului statistico-matematic de 
analiza a acestora ” (p.22). 

Mult mai contestat in §tiintele sociale, termenul de masurare se refera la operatia 
de atribuire de valori (sub forma de cifre sau simboluri) unitatilor statistice ale unei 
colectivitati observate, pe baza unui set de reguli de atribuire a valorilor. Utilizarea 
acestor reguli este posibila numai prin intermediul instrumentelor de masura: 
termometru sau rigla, in cazul masurarii temperaturii sau lungimii; testul sau 
chestionarul, in cazul masurarii unor variabile psihologice sau sociologice. Odata 
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instrumentele construite, procesul de masurare consta in citirea pe scalele acestor 
instrumente a unor valori reprezentand numarul de united fundamentale de masura. 
(Clocotici & Stan, 2001) 

Scalele (nivelurile) de masura nu sunt altceva decat regulile prin care sunt 
atribuite valori unitatilor statistice. „Cunoa$terea proprietatilor nivelurilor de 
masura, sustine Marginean (1982, p.70 ), prezinta importuned deoarece s-a dovedit 
ca o serie determinata de date permite, in mod legitim, sa se adopte un anumit nivel 
de masura sau tip de scald §i nu altul.” 

Practica statistice, tinand cont de natura variabilelor §i, mai ales, de modul lor de 
exprimare (vezi cap. 2.2.), opereaza cu patru tipuri fundamentale de scale (niveluri 
de masurare): scala nominale, scala, ordinala, scala de interval §i scala de raport. 
Fiecare dintre aceste scale se remarca prin procedee specifice de exprimare 
numerica, ceea ce determine utilizarea anumitor operatii de analiza §i prelucrare a 
datelor, foarte putine pentru nivelul nominal §i extrem de multe pentru cel de raport. 

Incheiem prin a remarca unele proprietati pe care trebuie sa le indeplineasca o 
scala de masura: 

sa fie consistent^, 
sa fie corecta, 
sa fie exhaustive §i 
sa fie mutual exclusive. 

Scala are consistenta interne dace produce rezultate (aproape) identice, atunci 
cand este folosite in mod repetat pentru acela§i obiect sau fenomen; este corecta 
dace produce informatia pe care o a§teptdm de la ea; are proprietatea de a fi 
exhaustiva atunci cand poate imsura toate entitetile cdrora le este destinatd; §i este 
mutual exclusiva atunci cand, in urma mdsurerii, fiecare entitate priincite o singure 
valoare (Clocotici & Stan, 2001). 


2.4. Scale de masura 

Scala nominala. Este cel mai simplu tip de scale §i presupune doar diferentierea 
calitative a obiectelor §i fenomenelor mdsurate. Aplicarea unei scale nominale la o 
colectivitate statistice inseamne, in esente, o clasificarea a indivizilor dupe o 
caracteristice sau un atribut. Prin intermediul acestei scale se exprime apartenenta 
unitetilor statistice investigate la o categorie. Din aceste considerente, intalnim acest 
tip de scale §i cu denumirile de scale calitative, categoriale sau de clasificare. 

Conditia fundamentale ce se cere unei scale nominale este, de fapt, cerinta 
elementara impusd oricerei clasificeri: data fiind multimea claselor scalei §i 
multimea indivizilor, fiecare individ sa se gaseasca in una §i numai una dintre clase 
(Rotariu et.al., 1999). 

Un exemplu clasic de variabile nominale utilizate in cerceterile psiho-sociale 
este caracteristica „gen ”, ale cerei variante (categorii, atribute) sunt: masculin §i 
feminin. Chiar dace, in activitatea concrete de inregistrare a datelor, celor doue 
categorii le sunt atribuite codurile 1 §i 2 (la fel de bine putem codifica aceea§i 
variabile prin m §i /), aceste numere sunt doar ni§te simboluri, intre ele existand un 
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raport de echivalenta §i nu unul de ordine. Nu putem afirma ca 2 este „mai mult” 
decat 1, ci doar ca este diferit de acesta! 

Alte scala nominale utilizate in psihologie §i sociologie sunt: - tipurilor tempera- 
mentale stabilite de Jung §i Eycenck: introvertit, extravertit, ambivert; - starea civila: 
necasatorit, casatorit, vaduv, ..optiunea politica: partidul A, partidul B, ... 

Scala ordinala. Ca §i cea nominala, scala ordinala se folose§te pentru 
exprimarea starilor unor variabile calitative. In plus, acest tip de scala vine cu cerinta 
ca intre categoriile (clasele) scalei sa existe o relatie de ordine. Aceste scalele sunt 
cunoscute §i sub numele de scale de ordine, scale de rang sau scale ierarhice. 

O scala ordinala permite ordonarea observatiilor, persoanelor, situatiilor de la 
mic la mare, de la simplu la complex etc., permitand astfel realizarea unor ierarhi 
(ranguri). In cazul scalelor ordinale putem stabili ierarhia celor „n” variante ale 
variabilei, insa nu putem preciza valoare diferentei dintre doua variante. 

Cel mai frecvent folosim acest tip de scala in studiul atitudinilor. Raspunsurile la 
o intrebare de genul „Cat de multumit sunteti de relatiile din colectivul din care 
faced parte?” pot fi cuantificate printr-o scala ordinala, ale carei clase sunt: 
multumit, §i multumit §i nemultumit, nemultumit. 

Un alt exemplu de scala ordinala este ierarhia nevoilor umane in conceptia 
psihologului american A. Maslow. Scala stabilita de el cuprinde urmatoarele 
categorii, ordonate de la simplu la complex: nevoi fiziologice; nevoi de securitate; 
nevoi sociale, de apartenenta la grup; nevoia de stima, de a fi apreciat de ceilalti; 
nevoia de autorealizare (Clocotici & Stan, 2001). 

Clasele pot fi §i aici codificate prin cuvinte care sa exprime semnificatia lor sau 
prin simboluri. Daca in cazul scalelor nominale simbolurile puteau fi atribuite 
oricum, de data aceasta ele trebuie sa evidentieze ordinea claselor. Cel mai frecvent 
§i simplu mod de a evidentia ordinea este folosire numerelor naturale: 1, 2, 3 .... 
Atragem atentia ca aceste simboluri numerice reprezinta numere ordinale §i nu 
cardinale, in consecinta, operatiile aritmetice (adunarea, scadere, inmultirea §i 
impartirea) nu pot fi utilizate nici de aceasta data (Rotariu et.al., 1999). 

Scala de intervale. Impreuna cu scalele de rapoarte, sunt utilizate pentru masu- 
rarea variabilelor cantitative §i presupune atribuirea de valori numerice unitatilor 
colectivitatii. Din acest motiv ele se mai numesc scari metrice sau numerice. 

Pe langa cele doua proprietati impuse de nivelurile anterioare de masurare, §i 
anume: 

- fiecare individ sa se gaseasca in una §i numai una dintre clase, 
intre categoriile (clasele) scalei sa existe o relatie de ordine, 
scalele metrice adauga o a treia: 

are sens luarea in considerare a distantelor dintre categoriile scalei. 

Aceasta proprietate face ca datele experimentale obtinute pe o scala metrica sa 
suporte aproape toate prelucrarile statistice posibile. 

Caracteristic pentru scala de interval este faptul ca utilizeaza o valoare 0 conventi- 
onala. Astfel, masurarea cu acest tip de scala este independents de originea aleasa §i 
de unitatea de masura folosita, putandu-se trece de la un sistem de masurare la altul. 
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Exemplul clasic il reprezinta masurarea temperaturii in sistemul Celsius §i in 
sistemul Fahreinheit. Trecand de la un sistem de masurare la altul, deci schimband 
zeroul conventional §i valorile temperaturii, raportul dintre doua modificari de 
temperatura ramane acela§i (Jaba & Grama, 2004). Un alt exemplu de astfel de scala 
il reprezinta scalele pentru masurarea inteligentei. 

Referindu-se la proprietatile scalelor de interval, M. Popa (2004) atrage atentia 
asupra faptului ca valorile obtinute prin masurari de acest tip nu ne permit evaluari 
de genul: „0 temperatura de 10 grade este de doua ori mai mare decat una de 5 
grade” sau, „0 persoana care a obtinut un scor de 30 de puncte este de doua ori mai 
inteligenta decat una care a obtinut 15 puncte”. Aceasta, deoarece nici temperaturile 
masurate pe scala Celsius §i nici inteligenta nu au o valoare 0 absoluta (daca 
acceptam ca nici un om viu nu are inteligenta nula). 

De asemenea, trebuie remarcat faptul ca cele mai multe dintre variabilele 
psihologice sunt expresia unor evaluari subiective, aspect ce face greu de demonstrat 
egalitatea intervalelor dintre doua valori consecutive. Uneori, chiar §i in cazul unor 
masuratori extrem de exacte este dificil de asumat acest lucru. De exemplu, daca 
masuram „iubirea” la un e§antion de cupluri care se plimba, prin durata „tinerii de 
mana”, nu putem fi siguri ca diferenta de „iubire” dintre cei care se tin de mana 10 
minute §i cei care se tin de mana 20 de minute este aceea§i ca in cazul diferentei 
dintre 20 §i 30 de minute. Cu toate acestea, multe dintre masuratorile studiilor 
psihologice sunt asimilate scalei de tip interval. (Popa, 2004) 

Scala de rapoarte sau scala de proportii (sau scala de interval cu origine 
rationale). Face parte din categoria scalelor metrice, fund folosita tot pentru 
exprimarea variabilele cantitative. 

Aceasta scala de masura poseda ca note distinctive existenta unei origini 
naturale (a unui 0 absolut; altfel spus, nu exista nici o valoare mai mica decat 
valoarea 0) §i precizarea clara a semnificatiei unitatii de masura, ceea ce face 
posibila compararea raporturilor dintre gradatiile scalei. 

Scala de rapoarte se folose§te pentru masurarea valorilor unor variabile precum 
venitul, inaltimea, timpul de reactie §.a. 

Dupa uni autori (Kinnear §i Gray, 2000, cf Sava, 2004a) §i dupa cum reiese §i 
din utilizarea programului SPSS, in care exista doar trei niveluri de masurare, 
tendinta actuala este de a renunta la diferentierea intre ultimele doua tipuri de scale. 
Aceasta pentru ca majoritatea procedurilor statistice utilizate in cazul scalelor de 
intervale sunt valabile §i pentru scalele de rapoarte. Termenul generic sub care se 
reunesc cele doua tipuri de scale este cel de scala numerica sau metrica. 


2.5. Definirea variabilelor statistice cu ajutorul SPSS 

Pentru crearea unei baze de date se incepe prin definirea variabilelor. Dupa 
aparitia ferestrei de intampinare din editorul de date SPSS se deschide fereastra de 
gestionare a variabilelor unde, pentru fiecare variabila, sunt specificate urmatoarele 
caracteristici: 
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■ Name - numele variabilei ( de exemplu : sex). 

■ Type - tipul variabilei, poate fi numeric, data calendaristica, string §.a. (in 

exemplul nostru: numeric). 

■ Width - numarul de caractere al variabilei (ex.: 1). 

■ Decimals - pentru variabilele numerice trebuie specificat numarul de carac¬ 

tere dupa virgula al variabilei (ex.: 0). 

■ Label - comentariu (eticheta) ce insote§te variabila (ex.: sexul subiectului). 

■ Values - valorile pe care le poate lua variabila §i comentariile/etichetele 

ata§ate acestora (ex.: 1 = „masculin”; 2 = „feminin”). 

■ Missing - specificarea cazurilor omise (ex.: None). 

■ Columns - numarul de spatii alocat in editorul de date acestei variabile (ex.: 8). 

■ Align - alinierea acestei variabile in editorul de date, poate fi aliniere la 

stanga, la dreapta sau centrat (ex.: Center). 

■ Measure - Nivelul de masurare al variabilei (tipul scalei), poate fi numeric 

(scale), ordinal §i nominal (ex.: Nominal). 
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3. 


ORDONAREA, GRUPAREA §1 
PREZENTAREA DATELOR STATISTICE 


3.1. Serii (distributii) statistice 

3.2. Gruparea (sistematizarea) datelor 

3.3. Prezentarea datelor sub forma de tabele 

3.4. Reprezentarea grafica a datelor statistice 

3.5. Utilizarea SPSS pentru ordonarea §i gruparea datelor statistice 

3.6. Utilizarea SPSS pentru prezentarea datelor statistice sub forma de tabele 

3.7. Utilizarea SPSS pentru reprezentarea grafica a datelor statistice 

3.1. SERII (DISTRIBUTII) STATISTICE 

In cazul unui numar foarte mare de date este imposibila (§i inutila) analiza 
fiecarei valori in parte. In aceasta situatie, inaintea prelucrarii §i analizei datelor se 
procedeaza la ordonarea, gruparea §i organizarea lor. Rezultatul ordonarii §i gruparii 
datelor statistice il constituie senile (distributing) statistice de frecvente. 

Acestea sunt formate din doua §iruri paralele de date din care unul reprezinta 
variantele/valorile variabilei (sau grupele de variante) iar celalalt numarul de unitati 
statistice corespunzatoare fiecarei valori sau variante (frecventele absolute sau 
relative) . Fiecare frecventa asociata valorii/variantei respective a caracteristicii 
studiate reprezinta un termen al seriei statistice . 


Exemplu : 



In functie de modul de prezentare al variantelor, seriile statistice, se impart in: 
serii simple - obtinute prin simpla in§iruire a valorilor individuale. Acestea sunt 
ulterior supuse operatiilor de ordonare §i grupare (daca numarul 
lor este suficient de mare), obtinandu-se astfel unul din 
urmatoarele doua tipuri de serii. 





serii de (pe) variante - cand flecSrei variante ii revine un anumit numSr de unitSti. 
serii de (pe) intervale - cand fiecarui interval, mSrginit de o limits inferioarS §i de 
una superioarS, ii revine un anumit numar de unitati. 

Ultimele douS tipuri se mai numesc §i serii (repartitii) de frecvente §i formeazS 
ceea ce numim o DISTRIBUTIE STATISTIC A. 


In functie de natura §i modul de manifestare ale variabilei studiate distingem 
doua tipuri principale de serii statistice: serii statistice cantitative sau calitative. La 
acestea putem adSuga alte doua tipuri de distribute statistice, la care criteriul dupS 
care se face diferentierea este spatiul sau timpul: serii statistice spatiale §i cronologice. 

Aceste criterii nu numai cS realizeazS o clasificare a seriilor statistice dar, vom 
vedea in capitolele urmStoare, determinS limitele §i specificul prelucrSrilor statistice 
complexe. Atunci cand variabilele sunt cantitative vom vorbi despre tehnici 
statisticeparametrice; in celSlalt caz, al caracteristicilor calitative, prelucrSrile ce le 
vom efectua vor fi de tip non-parametric. 

In concluzie, seria statistics de frecvente este rezultatul operatiilor de ordonare §i 
grupare. Prezentarea seriilor statistice se face sub forma in§iruirii, pe orizontalS sau 
pe verticals, a unor perechi de numere sau expresii, in care primul element 
reprezintS caracteristica (ce poate fi cantitativS sau calitativS, spatialS sau 
cronologicS), iar al doilea frecventa, intotdeauna numericS, a variantelor sau 
grupelor de variante ce delimiteaza caracteristica respectiva. In rapoartele de 
cercetare aceste distribute statistice, unele reflectand mai multe caracteristici 
concomitent, sunt ilustrate cu ajutorul tabelelor §i al graficelor. 

Reamintim urmatoarele notatii cu care operam in prezentarea §i prelucrarea 
distributiilor statistice: 

variantele sau grupele (clasele) de variante, x ; : x,, x 2 , ... x k , ... 
frecventa variantei x; (numarul de aparitii), /,: f\, f 2 , ... fk, ... 
numarul total de variante (total frecvente) n: n = X/j i — 1,2, ...k, ... 

In cazul seriilor statistice de intervale se presupune ca toate valorile din 
interiorul fiecarei grupe (clase) se concentreaza in valoarea centrala a clasei, notata 
tot cu X;. Aceasta valoare va inlocui in seria statistics intervalul respectiv §i se 
calculeazS ca medie aritmeticS a valorilor extreme ale intervalului: 


x : = 


X -U x 

max min 


(3-D 


MentionSm faptul cS o distribute statistics poate reda pe langS frecventele 
absolute (/ sau /„) §i pe cele relative (/,). Acestea sunt absolut necesare cand se 
dore$tc compararea unor e§antioane cu numSrul total de variante (n) diferit {de 
exemplu: in cazul a douS clase cu numSr total de elevi diferit). Mai mult, atunci cand 
prelucrSrile statistici ulterioare o impun, putem determina §i alte frecvente: 

frecventa (absolutS sau relativS) cumulatS crescStor, datS de suma 
frecventelor valorilor care apar nanS la valoarea x ; respectivS, inclusiv; 
frecventa (absolutS sau relativS) cumulatS descrescStor, datS de suma 
frecventelor valorilor care apar de la valoarea x ; respectivS, inclusiv. 
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3.2. Gruparea (sistematizarea) datelor 


Gruparea statistica reprezinta o operatie de sistematizare a populatiei pe parti 
statistic omogene in functie de variatia 1 unei variabile (sau a mai multora). 

Importanta acestei operatii initiate deriva din erorile ce pot fi induse fie in cazul 
stabilirii unui numar foarte mare de grupe (clase) - situatie in care se ajunge la 
„faramitarea” colectivitatii fie in situatia alegerii unui numar prea mic de grupe, 
cu intervale foarte mari in cadrul lor - situatie in care nu vom surprinde tipurile 
calitative existente. 

In cazul variabilelor numerice (cantitative) putem realiza 

1) grupari pe variante - utilizate in cazul variabilelor de tip discret, cand ele pot lua 

doar valori intregi ( exemple : numarul membrilor unei 
familii, no tele §colare). 

2) grupari pe intervale - utilizate in cazul variabilelor de tip continuu, cand ele pot 

lua orice valoare intr-un interval finit sau infinit ( exemple : 
timpul de reactie, mediile §colare anuale, inaltimea). 

Mentionam faptul ca §i variabilele de tip discret pot fi supuse gruparilor pe 
intervale ( exemplu : note intre 2 §i 4; 5-7; 8-10 etc.). In ambele situatii marimea 
intervalului (K) se obtine cu ajutorul formulei lui H.A. Sturges: 

Y _ Y 

_ max min 

_ 1 + 3,322 • lg n 

unde, n reprezinta numarul total de variante. 

In situatia in care numarul de grupe este ales de cercetator (bazandu-se pe 
experienta §i intuitie), marimea intervalului (K) rezulta astfel: 

in cazul variabilelor de tip continuu, prin raportarea amplitudinii 
variatiei (A = x max - x min ) la numarul de grupe: 

K = Xmax ~ Xmin (3.3) 

nr. grupelor 

in cazul variabilelor de tip discret, prin raportarea numarului valorilor 
diferite ale variabilei (N x = x max - x min t l A + 1) 1 a numarul de grupe: 

X — X +1 

K max min /o a \ 

=-:- -4) 

nr. grupelor 


1 Variatia reprezinta proprietatea unei variabile de a inregistra mai multe valori (in cazul 
variabilelor cantitative) sau mai multe forme de manifestare (in cazul variabilelor 
calitative) (Blezu, 2002). 
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O atentie deosebita trebuie acordata precizarii limitelor sau capetelor 
intervalelor. In cazul caracteristicilor discrete limitele intervalelor ies foarte bine in 
evidenta, ele fiind diferite ( exemplu: intervalele 2-4; 5-7; 8-10). 

Mai delicat este cazul caracteristicilor continui, cand trebuie precizat care dintre 
intervale include limita sau, altfel spus, care capat al intervalului este deschis/inchis 
0 exemplu : intervalele (2-4]; (4-6]; (6-8] etc. sunt deschise in partea stanga). Pentru 
evitarea confuziilor se procedeaza din start la departajarea limitelor, astfel: 2,01-4; 
4,01-6; 6,01-8 etc. 


3.3. Prezentarea datelor sub forma de tabele 

Prezentarea datelor sub forma unui tabel statistic permite atat o buna vizualizare 
cat §i, mai ales, efectuarea diverselor calcule in procesul de prelucrare a datelor. 

In elaborarea unui tabel pot fi identificate urmatoarele elemente §i reguli 
principale (Novak, 1995): 

- titlul tabelului - care trebuie sa fie clar, scurt §i sa defmeasca exact fenomenul pe 

care il reprezinta §i, dupa caz, perioada la care se refera; 

- macheta tabelului - formata din liniile orizontale (randuri) §i liniile verticale 

(coloane) din intretaierea carora apar rubricile (celulele, casutele) care contin 
datele numerice §i/sau denumirile textuale; 

- subiectul tabelului - inscris de obicei la capatul randurilor, este constituit din 

unitatile populatiei statistice (ex.: grupe de note, grupe de puncte etc); 

- predicatul tabelului - inscris de obicei la capatul coloanelor, cuprinde ansamblul 

indicatorilor care se inregistreaza la nivelul unitatilor populatiei statistice; 

- indicarea obligatorie a sursei de date , atunci cand este cazul (de obicei sub tabel); 

- se recomanda indicarea unitatilor de masura in care se exprima datele (de obicei, 

intre titlul §i macheta tabelului); 

- se recomanda numerotarea tabelelor - pentru identificarea mai u§oara a acestora in 

textul de analiza. 

In functie de scopul intocmirii, de continutul lor §i de numarul caracteristicilor 
studiate tabelele pot fi de mai multe tipuri. Astfel: 

a) Tabele ale unor serii statistice 

Pot fi intocmite atat pentru seriile de variante cat §i pentru cele de intervale. 
Diferenta este data de randurile tabelului care vor constitui variantele seriei, in 
primul caz, sau clasele de variante (eventual valorile centrale), in cel de-al doilea 
caz. In ambele situatii pe coloane vor fi trecute ifecventele, absolute sau relative, 
cumulate sau descrescatoare. ( Exemplu : a se vedea tabelul 3.3) 

b) Tabele centralizatoare 

Sunt utilizate in toate situatiile in care un numar mare de date trebuie stocate §i 
conservate in vederea prelucrarii lor ulterioare. In lucrarile §tiintifice aceste tabele 
sunt, de obicei, prezentate sub forma de anexe, §i contin pe coloane totalitatea 
variabilelor studiate, iar pe randuri, totalitatea unitatilor statistice (colectivitatea 
statistica) investigate. 


24 



c) Tabele comparative 

Cuprind fie datele obtinute pe e§antioane diferite pentru aceea§i caracteristica, 
fie datele aceluia§i e§antion pentru caracteristici diferite. 

d) Tabele cu dubla sau trip la intrare 

In acest caz, §i coloanele §i randurile exprima variatiile uneia sau a doua 
caracteristicii (variabile). Fiecare celula exprima numarul de unitati statistice 
caracterizate prin variantele corespunzatoare tuturor caracteristicilor de pe orizontala 
§i verticala. 


3.4. Reprezentarea grafica a datelor statistice 

Cu ajutorul reprezentarilor grafice sunt vizualizate informatiile statistice, 
facilitandu-se perceperea pe ansamblu a datelor, sesizarea unor aspecte privind 
variatia valorilor observate, repartitia lor, legaturile existente intre ele §.a. 

Graficul trebuie sa cuprinda: 

titlul - care poate fi plasat fie sub, fie deasupra graficului §i trebuie sa precizeze 
limpede fenomenul pe care il reprezinta; 

legenda - utilizata pentru specificarea anumitor simboluri sau conventii 
utilizate; 

sistemul axelor rectangulare (daca este cazul) - in care linia orizontala (abscisa) 
cuprinde valorile variabile x, iar cea verticala (ordonata) cuprinzand 
frecventele f; 

se recomanda numerotarea graficelor - pentru identificarea mai u§oara a 
acestora. 

Graficele cel mai des utilizate sunt graficele de tip bard, histogramele, 
poligoanele de frecvente, §i curbele de distribute, pe abscisa notandu-se intervalele 
de variatie (sau variantele), iar pe ordonata frecventele corespunzatoare acestor 
intervale (sau variante). Aceste reprezentari grafice se obtin prin unirea intersectiilor 
perpendicularelor ridicate din punctele perechi de pe cele doua axe. in cazul seriilor 
de intervale perpendiculara pentru desemnarea valorii frecventei se ridica din 
mijlocul intervalului, respectiv din punctul corespunzator valorii centrale a clasei. 

Graficele de tip bara 2 le folosim cand dorim sa reprezentam fie variabile 
cantitative discrete, fie variabile categoriale (masurate prin scale nominale sau 
ordinale). Caracteristic acestui tip de grafic este faptul ca barele verticale sunt 
delimitate de un spatiu, iar ordinea barelor poate fi schimbata. 

Histogramele §i poligoanele de frecvente sunt reprezentarile grafice utilizabile in 
cazul seriilor statistice cantitative, insa numai atunci cand variabilele sunt continue. 
De exemplu, situatia absolventilor de liceu dupa examenul de admitere la facultate 
(exprimata prin doua variante: „admis”, „respins”) va fi reprezentata printr-un grafic 
de tip bara (deoarece avem de-a face cu o variabila calitativa, masurata printr-o scala 


2 in engleza: bar graph. 
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nominala), iar mediile la bacalaureat ale acelora§i absolventi printr-o histograma sau 
printr-un poligon de frecvente (deoarece avem o variabila cantitativa continua sau, 
altfel spus, o variabila masurata printr-o scala numerica). 

Pentru a evidentia §i/sau compara structurile se utilizeaza iliagramele de 
structura, construite cu ajutorul suprafetelor (cercuri, patrate, dreptunghiuri), 
diagramele de comparatie §i reprezentarile prin figuri simbolice §.a.. in multe 
cazuri, sunt studiate mai multe caracteristicii folosindu-se reprezentari grafice 
complexe precum: piramide ale vdrstelor, grafice comparative, grafice combinate. 


Grafic de tip bara (Bar Graph) 



Histograma 

frecvente 
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medii la examenul de bacalaureat 
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In ce private diagramele sub forma figurilor geometrice (cere, patrat, 
dreptunghi) utilizate atat pentru prezentarea structurilor cat §i/sau pentru compararea 
in timp a evolutiei fenomenelor se procedeaza astfel (Novak, 1995): 

- se construiesc cele doua figuri in a§a fel, incat raportul dintre raze (sau laturi) sa fie 

proportional cu nivelurile fenomenului studiat in cele doua perioade diferite de 
timp (in doua localitati etc.); 

- in cadrul fiecarei figuri geometrice se reprezinta structure corespunzatoare anului 

(spatiului geografic) respectiv. 


Structura esantionului dupa notele la examen 


□ 2-4 
14 % 



□ 2-4 

□ 5-7 

□ 8-10 


3 . 5 . Utilizarea SPSS PENTRU ORDONAREA §1 GRUPAREA date- 
LOR STATISTICE 

ORDONAREA DATELOR STATISTICE CU AJUTORUL SPSS 

Se parcurge, in bara de meniuri, traseul: 

,J)ata ” - „Sort cases... ” 

Va fi afi§ata fereastra de dialog din figure 3.1. 

Dupa ce selectam variabila dupa care dorim sa facem ordonarea (prin trecere ei 
din stanga in fereastra intitulata „Sort by:”) ne mai ramane sa alegem sensul 
ordonarii: crescator/ascendent sau descrescator/descendent. Se poate realiza sortarea 
datelor dupa mai multe variabile; in acest caz, se va tine cont de ordinea variabilelor 
in fereastra „Sort by:”. 
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Figura 3.1. Fereastra de dialogpentru sortarea (ordonarea) datelor 


3.6. Utilizarea SPSS pentru prezentarea datelor 

STATISTICE SUB FORMA DE TABELE 

Pentru calcularea frecventelor absolute §i/sau relative ale unei serii statistice 
simple sau de variante, precum §i pentru redarea sub forma tabelara a distributiei de 
ffecvente, se parcurge, in bara de meniuri, traseul: 

„ Analyze ” - „Descriptive Statistics ” - frequencies... ” 

Vom fi intampinati de fereastra urmatoare, in care, in partea stanga sunt a fixate 
toate variabilele din baza de date (in ordine alfabetica sau in ordinea defmirii lor). 



Figura 3.4. Fereastra de int&mpinare (de dialog) pentru calculul frecventelor 


3.7. Utilizarea SPSS pentru reprezentarea grafica a 

DATELOR STATISTICE 


28 








































Pentru a obtine o reprezentare grafica aferenta seriei statistice respective, 
revenim la fereastra de intampinare pentru calculul frecventelor (figura 3.4) §i 
apasam butonul „ Charts 



Figura 3.7. Fereastra de optima pentru reprezentarea grafted a datelor statistice 

Va aparea o noua fereastra in care, inainte de a apasa butonul „Continue”, vom 
opta pentru una din urmatoarele situatii f Chart Type”): 

„None”, cand nu se dore§te reprezentarea grafica a variabilei; 

,,Bar charts”, reprezentare (printr-un „grafic de tip bara”) folosita pentru 
serii statistice calitative sau pentru seriile de freevente (de variante sau de 
intervale) in care variabila este discontinua; aici putem opta pentru afi§area 
valorilor pe grafic ( „Chart Value ”) sub forma frecventelor absolute 
(,frequencies ”) sau a celor relative ( percentages ”); 

„Pie charts”, reprezentare grafica sub forma diagramei de structura prin 
arce de cere folosita pentru serii statistice calitative sau pentru seriile de 
freevente (de variante sau de intervale) cu numar redus de variante; avem 
posibilitatea acelora§i optiuni de mai sus; 

„ Histograms ”, reprezentare grafica sub forma de histograma folosita pentru 
serii statistice cantitative simple sau de variante, in care variabila este de tip 
continuu; aici se poate opta pentru trasarea curbei distributiei normale prin 
activarea casutei „With normal curve”. 


29 




















4. 


INDICATOR! AI 
TENDINTEI CENTRALE 

9 


4.1. Mediile 

4.2. Quantilele: mediana, quartilele, decilele §i centilele 

4.3. Modul 

4.4. Relatia dintre indicatorii tendintei centrale 

4.5. Reprezentari de tip Boxplots 

4.6. Utilizarea SPSS pentru calcularea §i reprezentarea indicatorilor de pozitie 


In cele mai multe investigate psihosociale sau educationale prezentarea rezultatelor 
sub forma tabelara sau prin reprezentari grafice nu este suficienta. Prin intermediul unor 
indicatori statistici putem realiza o prelucrare mult mai riguroasa a datelor, putem 
cunoa§te mult mai temeinic fenomenele studiate. 

Termenul de „indicator” se refera la acele „valori ata$ate variabilelor statistice 
cantitative prin intermediul carora se incearca exprimarea, de o maniera sintetica a 
informatiei continuta in distributia de frecvente respectiva” (Rotariu et. al., 1999, p. 
42). 

in functie de natura informatiei oferita de indicatorii statisticii, ace§tia se clasifica 
in trei mari categorii: 

indicatori ai tendintei centrale (de pozitie sau de nivel), 
indicatori ai variatiei (de dispersie sau de impra§tiere), 
indicatori ai formei distributiei. 

Pentru a determina modul in care datele statistice tind sa graviteze in jurul unor 
valori centrale se folosesc indicatorii tendintelor centrale. Dintre ace§tia vom prezenta: 
media, quantilele (mediana, quartilele, decilele §i centilele) §i modul. 


4.1. Med iil e 

Marimile medii exprima ceea ce este comun §i general in forma de manifestare a 
fenomenelor studiate. 

Pentru a ne fi de folos, insa, calculul marimilor medii trebuie sa indeplineasca 
anumite conditii: 

sa se bazeze pe un numar suficient de mare de cazuri individuate; 
valorile individuate ate caracteristicii sa nu difere prea mult de la o unitate 
statistic^ la alta, adica sa avem o colectivitate omogena; 



mSrimea medie aleasS pentru calcul sS corespundS cel mai bine formei de 
variatie a caracteristicii studiate §i sa valorifice cel mai bine materialul citric 
de care dispunem (Novak, 1995). 


Media aritmetica 

Media aritmetica (m, x sau p 1 ), reprezintS, in cazul datelor negrupate (serii 
simple), raportul dintre suma valorilor variabilei respective §i numSrul lor. 



n 


(4.1) 


Daca datele sunt grupate (distributii de frecvente), media - numitS uneori medie 
aritmetica ponderatS 2 - va fi: 


m = 


£*/ •/, 
V) 


(4.2) 


in cazul grupSrii valorilor pe intervale, in formula de mai sus x, reprezinta 
valoarea centrals a intervalului. 


Proprietatile mediei aritmetice: 

• daca la toate valorile seriei statistice se adaugS (scade) o constants c, atunci 
media se mSre§te (scade) cu acea valoare: daca y t -x t +c, atunci m x = m y +c 

• daca toate valorile seriei statistice se inmultesc (divid) cu o constants c, atunci §i 
media se va multiplica (divide) cu aceea§i valoare c: dacS y. = c ■ x t , atunci 
m y =c-m x 

• suma abaterilor valorilor de la medie este intotdeauna nulS: ^ x t - m = 0 

• suma pStratelor abaterilor de la medie va fi intotdeauna mai micS decat suma 
pStratelor abaterilor de la oricare alt punct al distributiei. 


4.2. Quantile 3 

O alta categorie de indicatori ai tendintelor centrale o reprezinta quantilele. 
Acestea sunt indicatori de pozitie si au rolul de a impartii seria de date intr-un 
anurnit numar de parti. Dintre quantilele cele mai des calculate amintim: 


1 m §i X (x barat) se folosesc atunci cand ne referim la media unui e§antion (situatia cea mai 
frecventa), iar p (miu) atunci cand calculam media intregii populatii de referinta. 

2 Pentm a intelege corect sensul termenului de medie ponderata recomandam urmatoarea 
referinta bibliografica: Rotariu et. al, 1999, pp. 43-44. 

3 In limba engleza, se numesc percentiles. 
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Mediana (M sau M e ), este valoarea care imparte seria ordonata de date in 
doua parti egale. Jumatate din valori (50%) se gasesc in partea stanga a 
medianei iar cealalta jumatate in partea dreapta. 

Pentru calculul medianei este absolut necesara ordonarea seriei statistice, fie 
crescator, fie descrescator (aspect fara importanta in cazul calculului valorilor 
medii!). 

Pentru a afla al catelea element al unei serii cu numar impar de tenneni este 
mediana se calculeaza cota medianei dupa fonnula; 

Cota M = (n+l)/2 (4.7) 

De exemplu, presupunand ca notele, ordonate crescator, obtinute de un lot 
de noua subiecti sunt: 

456778889 

cota medianei va fi (9+l)/2 = 5, astfel incat mediana va corespunde celui de-al 
cincilea tennen din serie, adica 7. Se observa ca si in stanga si in dreapta acestei 
valori se afla un numar egal de tenneni. 

Pentru seriile fonnate dintr-un numar par de valori fonnula (4.7) ramane 
valabila, numai ca rezultatul nu va mai fi intotdeauna un numar intreg. Vom 
vorbi de doi tenneni centrali, pozitia medianei fund intre tennenul n/2 si 
(n/2)+l. In acest caz, mediana se calculeaza facand media celor doua valori, 
putand sa coincida (daca valorile corespunzatoare tennenilor n/2 si (n/2)+l sunt 
egale), sau nu (in caz contrar), cu una din valorile seriei. 

Daca in exemplu anterior mai apare un subiect cu nota 9 vom avea o serie 
cu zece tenneni: 

4567788899 

mediana va fi data de media valorilor corespunzatoare tennenilor cinci §i 
§ase, adica 7,5. 

Lucrurile devin mult mai complicate daca ne referim la distributii de 
frecvente 4 . 

Quartilele (Q) reprezinta alte tipuri de quantile, ele impartind seria de date 
in patru parti egale, astfel: 

quartila 1 (Qi) imparte valorile in 25% (un sfert) si, 
respectiv, 75% (trei sferturi); 

quartila 2 (Q 2 = M) imparte seria de date in doua jumatati 
egale, ea fund, de fapt, mediana; 

quartila 3 (Q 3 ) imparte seria ordonata in 75% si, respectiv, 
25%. 


4 Pentru unii indicatori ai tendintei centrale formulele de calcul sunt mai complexe atunci 
cand datele sunt grupate. Tratatele de statistica aplicata prezinta in amanunt toate aceste 
formule. 
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Analog, se definesc si celelalte quantile: decilele (impart o serie ordonata in 
zece parti egale) si centilele (impart o serie ordonata intr-o suta de parti egale). 


4.3. Modul (Valoarea modala) 

Modul «sau valoarea modala» (M 0 ), reprezinta valoarea caracteristicii care 
prezinta frecventa cea mai mare, care apare de cele mai multe ori in seria de date. 

De exemplu, in cazul unei serii simple de date de forma: 

4556778889 

modul va fi 8, aceasta valoare aparand de cele mai multe ori in cadrul seriei. 

Pentru o serie de variante, modul este egal cu varianta care are cea mai mare 
frecventa, iar pentru o serie de intervale, fie se calculeaza media intervalului cu cea 
mai mare frecventa, fie ramanem doar la notiunea de interval modal. 

De cele mai multe ori seriile statistice au un singur mod, situatie in care spunem 
ca avem o distributie unimodala. Daca intalnim doua sau mai multe valori modale 
vom avea distribute bi- sau multimodale (vezi capitolul 6.3.). 


4.4. Relatia dintre medie, MEDIANA §1 MODUL 

in functie de aspectul (grafic) al unei serii statistice cele trei valori medii pot sa 
coincida, sau nu. in prima situatie vom vorbi de o distributie normala (gaussiana) 
sau vom afirma ca populatia din e§antionul studiat este distribuita „normal”, este 
omogena in raport cu variabila respective (vezi capitolul 6.3.). 

in ceieialt caz, nu toti cei trei indicatori sunt reprezentativi; va trebui se tinem 
seama de modul de exprimare al variabilei, motiv pentru care se impun urmetoarele 
precizeri: 

media este recomandate in cazul variabilelor numerice care indeplinesc 
conditiile parametrice (distributie normale, omogenitate §.a.); 
mediana se recomande pentru cazurile in care nu sunt indeplinite conditiile 
parametrice (distribute asimetrice, eterogenitate crescute etc) §i in cazul 
variabilelor de tip ordinal 

modul este utilizat mai rar pentru date numerice, fiind insa foarte util in 
cazul variabilelor de tip categorial (date calitative, nominale), deoarece nu 
putem calcula ceilalti parametrii centrali (Sava, 2004b). 

intre aceste trei caracteristici medii de baza existe o relatie aproximative, 
stabilite de G.U. Yule §i M.G. Kendall, valabila pentru distributii moderat 
asimetrice: 

M 0 = M e - 3>{m - M e ) (4.8) 
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4.5. Reprezentari tip Boxplot 

O modalitate specified de a reprezenta tendinta cazurilor unei serii statistice de a 
se grupa in jural unor valori centrale o reprezinta diagramele de tip Boxplot. Acestea 
marcheaza printr-un dreptunghi (o cutie) cele trei quartile — Q1, Q2, §i Q3 - ale 
oricarei serii statistice §i prin doua linii distincte cea mai mica, respectiv cea mai 
mare valoare a seriei. Din acest motiv, despre aceasta reprezentare se mai spune ca 
reprezinta o rezumare prin cinci valori. 

Intre cele doua quartile Q1 §i Q3 (in interiorul dreptunghiului) se regasesc 50% 
din cazuri. Mai mult, sunt reprezentate, atunci cand este cazul, valorile extreme 5 
(mai mici/mari de 1.5, respectiv 3 lungimi de cutie 6 - simbolizate prin cere, 
respectiv asterisc). 



N= 32 


varsta subiectilor 


Figura 4.1. Reprezentare grafted de tip Boxplot a variabilei „ Varsta subiectilor” 


5 In engleza, outliers. 

6 Lungimea (inaltimea) cutiei reprezinta abaterea interquartila: I = Q 3 -Q 1 - vezi cap. 5.1. 
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4.6. Utilizarea SPSS PENTRU CALCULAREA §1 REPREZENTAREA 
GRAFICA AINDICATORILOR DE POZITIE 

Cu ajutorul programului SPSS valorile tendintei centrale se obtin cu mare 
u§urinta, existand mai multe posibilitati. 

Una dintre posibilitati este amintita in capitolul anterior, presupunand traseul: 

„ Analyze ’’ - descriptive Statistics ’’ - frequencies... ” 

Dupa ce, in fereastra de dialog pentru calculul frecventelor (vezi figura 3.4.), 
selectam variabila sau variabilele dorite, apasam butonul Statistics...” §i vom 
patrunde intr-o noua fereastra de optiuni (figura 4.2). 



Figura 4.2. Fereastra de optiuni pentru calculul unor indicatori statistici 

La rubrica fere entile Values ” putem opta pentru calculul quartilelor sau a 
oricaror altor quantile ( Percentiles) care sa imparta seria in intervale egale (equal 
groups), sau inegale. 

La rubrica fentral Tendency” se opteaza pentru calcularea mediei aritmetice 
{Mean), medianei {Median), Modului {Mode) sau sumei valorilor {Sum). 
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5. 


INDICATORS AI VARIATIEI §1 
INDICATORI AI FORMEI 


5.1. Indicatori simpli (elementari) ai variatiei 

5.2. Indicatori sintetici ai variatiei 

5.3. Indicatori ai formei distributiei 

5.4. Utilizarea SPSS pentru calcularea indicatorilor variatiei §i ai formei 


Utilizarea mediei pentru caracterizarea a ceea ce este comun §i tipic in 
colectivitatile statistice trebuie sa fie insotita de verificarea reprezentativitatii 
acesteia pentru intreaga serie de valori individuate. Vom analiza cu ajutorul unei alte 
categorii de indicatori, numiti indicatori ai variatiei (de dispersie sau de 
imprastiere), masura in care valorile individuate variaza in jurul mediei sau, altfel 
spus, gradul de imprastiere (de dispersie) a indivizilor in cadrul seriei de valori pe 
care ace§tia le iau. Putem avea serii statistice cu aceea§i medie, insa cu o distributee a 
valorilor diferita, adica e§antioane diferite din punct de vedere al variabilitatii §i 
omogenitatii (vezi figura 5.1.). 

La randul lor, indicatorii variatiei se impart in indicatori simpli §i indicatori 
sintetici. 



Figura 5.1. Distributii statistice cu acelea§i valori centrale, dar cu grade diferite de 

variabilitate 








5.1. Indicatori simpli (elementari) ai variatiei 

Se obtin prin compararea a doi termeni din serie sau prin compararea oricarui 
termen al seriei cu o valoare fixa din cadrul seriei. Indicatorii simpli sunt 
amplitudinea, abaterea interquartila §i abaterile individuate. Toti indicatori pot fi 
exprimati in marimi absolute (adica in unitatea de masura a caracteristicii analizate) 
sau in marimi relative, calculate in raport cu media sau mediana. 

Amputudinea 

Amplitudinea (A), 1 se obtine prin diferenta dintre valoarea cea mai mare §i cea 


mai mica a caracteristicii respective. 



Amplitudinea absoluta : 

^ *^max ^min 

(5.1) 

Amplitudinea relativa: 

X — X 

yj _ max min 

(5.1’) 


m 


Acest indicator este cel mai simplu de calculat dar §i cel mai dezavantajos, 
deoarece tine seama doar de doua valori, cele extreme, fara a oferii informatii despre 
termenii din interiorul seriei. 

lata doua serii statistice (de exemplu: notele obtinute de elevi unei clase la doua 
discipline diferite) care au aceea§i amplitudine: 

prima serie: 234445566667788899 10 

a doua serie: 255555666666667777 10 

In ambele cazuri amplitudinea va fi 8 (A = x max - x min = 10-2 = 8), insa prima 
serie prezinta o variatie reala a notelor, pe cand in cea de-a doua valorile extreme pot 
fi considerate exceptii (atipice), nivelul redus al variatie nefiind reflectat deloc in 
valoarea amplitudinii. 

Din aceste motive, utilizarea amplitudinii in vederea caracterizarii 
omogenitatii/eterogenitatii unei serii statistice trebuie facuta cu rezerve, doar atunci 
cand valorile extreme nu se abat foarte mult de la ceilalti termeni ai seriei. 


Abaterea interquartila 

Abaterea interquartila (I) sau abaterea quartila, se obtine prin diferenta 
dintre quartila cea mai mare §i cea mai mica a caracteristicii respective 1 2 . Dupa cum 
am aflat in capitolul anterior, quartilele sunt in numar de trei (notate Qi, Q2, Q3); ele 
impart seria statistic!! in patru parti egale (vezi cap. 4.2.). Reamintim ca Q 2 este de 
fapt mediana seriei. 


1 In engleza: Range. 

2 Similar pot fi definite abaterile interdecile sau intercentile. 
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Abaterea interquartila absoluta : 

i = Q 3 -Qx 

(5.2) 

Abaterea interquartila relativa : 

j Qi~Q\ 

Q2 

(5.2’) 


Prin utilizarea acestui indicator sunt eliminate valorile extreme, mai precis, 
valorile situate in primul sfert (intre x min §i Q,) §i ultimul sfert (intre Q 3 §i x max ) al 
seriei, reducandu-se astfel influenta acestora. Abaterea interquartila este preferata in 
locul amplitudinii atunci cand valorile extreme din cadrul seriei sunt atipice, adica se 
abat prea mult de la ceilalti termeni ai seriei. Acest indicator este reprezentat grafic 
cu ajutorul diagramelor de tip Boxplot (vezi capitolul 4.5.). 

Reluand exemplul de mai sus, pentru a doua serie statistic^ abaterea interquartila 
este I = Q 3 -Qi = 7- 5 = 2, ceea ce reflecta mult mai bine lipsa de variatie a 
valorilor seriei. 

255555666666667777H) 

Xmin Ql Q2 Me Q3 X max 

Cu toate acestea, nici in acest caz nu avem informatii despre ce se intampla intre 
cele doua quartile extreme, mai mult, apare dezavantajul eliminarii a jumatate din 
termenii seriei (din acest motiv, uneori calculam abaterea interdecila, care elimina o 
cincime dintre valori, sau chiar abaterea intercentila, aceasta eliminand doar a 
cincizecia parte dintre valori). 

Toate aceste dezavantaje induse de amplitudine §i de abaterea interquartila pot fi 
eliminate daca se calculeaza abaterile (diferentele) nu doar dintre doua valori, ci 
intre toate valorile seriei respective. Se obtine astfel un indicator cunoscut sub 
numele de indicele lui Gini 3 , mai putin folosit de catre psihologi, sociologi sau 
pedagogi. Mai cunoscute sunt acele abateri calculate pentru toate valorile 
caracteristicii prin raportare la o valoare fixa, de obicei media sau mediana. 


Abaterile individuale 

Abaterile (deviatiile) individuale (dj), mai precis abaterile individuale de la 
medie 4 , se obtin prin diferenta dintre fiecare valoare §i media aritmetica a 
caracteristicii respective. La fel pot fi calculate abaterile individuale de la mediana 
sau de la oricare alta valoare din cadrul seriei. 

Conform proprietatilor mediei (vezi capitolul 4.1.) suma acestor abateri 
individuale este intotdeauna egala cu zero. 


3 Indicele lui Gini (dupa numele statisticianului italian Corado Gini) este definit ca: media 
aritmetica a diferentelor dintre toate perechile de valorii, diferente luate in valoare 
absoluta/in modul (pentru formule vezi T. Rotariu et. al., 1999, p. 52). 

4 in practica statistics! cele mai dese abateri individuale sunt calculate in raport cu media 
aritmetica, din acest motiv de cele mai multe ori, pentru a simplifies, vom folosi termenul 
de abatere individuals in locul celui de abatere individuals de la medie. 
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Abaterile individuate absolute : 


d: = X: -m 


( 5 . 3 ) 


Abaterile individuale relative : 


cL 


x i - m 
m 


(5.3’) 


Abaterile individuale ne ofera informatii doar despre pozitia unuia sau altuia 
dintre subiecti in raport cu media seriei, fara insa a surprinde in mod sintetic gradul 
de variatie al caracteristicii. Pentru aceasta trebuie considerate toate abaterile 
individuate ate valorilor caracteristicii de la media lor, lucru posibil de realizat doar 
cu ajutorul indicatorilor sintetici ai variatiei. 


5.2. INDICATORI SINTETICI AI VARIATIEI 

Ace§ti indicatori au la baza calcularea valorii medii a tuturor abaterilor 
individuate ate variantelor de la media lor (se poate lua ca reper §i mediana seriei sau 
oricare alta valoare a seriei!). Se realizeaza astfel o sintetizare a variatiei unei 
caracteristici printr-o singura expresie numerica. 

Indicatorii sintetici sunt abaterea medie liniard, dispersia , abaterea medie 
pdtraticd §i coeficientul de variatie. Vom prezenta formulele pentru seriile simple §i 
pentru seriile (distributiile) de frecvente. 


Abaterea medie liniara 

Abaterea (deviatia) medie liniara (d) sau pur §i simplu abaterea medie, 5 se 

calculeaza ca o media aritmetica a tuturor abaterilor individuate, luate in valoare 
absoluta (fara a lua in considerare semnul - sau +). 

VI x i - ml 

Abaterea medie in cazul seriilor simple'. d =- (5.4) 

n 


Abaterea medie in cazul seriilor de frecvente : 


Vbc, -m •/ . 
d = AA^. - Ll 

X/, 


(5.4’) 


Prin luarea in considerare a valorilor absolute se elimina, de fapt, acel 
inconvenient generat de proprietatea mediei aritmetice prin care suma abaterilor 
individuate este intotdeauna egala cu zero, adica X x , - m- 0 . 

Abaterea medie ne arata cu cat se abate in medie fiecare valoare de la nivelul 
mediu §i se exprima in unitatea de masura a caracteristicii studiate. Dezavantajul 
acestui indicator consta in faptul ca el acorda aceea§i importanta tuturor abaterilor 


5 §i de data aceasta, pentru simplificare, atunci cand folosim termenul de abatere medie ne 
referim la abaterea medie de la medie. Se poate calcula abaterea medie de la mediana sau 
de la oricare alta valoare a seriei. 
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individuale, fara sa tina seama de abaterile individuate mai mari care, in valoare 
absoluta, influenteaza in mai mare masura gradul de variatie. 


DlSPERSIA 

Dispersia (s 2 sau a 2 ) 6 sau varianta , 7 se calculeaza ca o medie aritmetica a 
patratelor abaterilor individuate ate tuturor valorilor fata de media lor. 


Dispersia in cazul seriilor simple : 



(5.5) 


Dispersia in cazul seriilor de frecvente : 


2 


S 


Tf, 


(5.5’) 


Estimarea dispersiei uneipopulatii, calculata pe baza unui e§antion 8 : 

s 2 ~ m Y 

n -1 

2 _ Z( x / - ,n f 'ft 

s - (Zfi )-1 


(5.6) 

(5.6’) 


Sunt autori care sustin ca termenul de dispersie ar trebui evitat deoarece el „este 
unul generic, fund utilizat pentru toti indicatorii din categoria celor care reflecta 
impra§tierea valorilor ” (Rotariu et.al., 1999, p. 42). Pe de alta parte, varianta 
reprezinta „indicatorul sintetic de baza al dispersiei ” (Ludu§an et.al., 1997, p. 277) 
sau „indicatorul statistic cel mai utilizat pentru aprecierea impra§tierii datelor” 
(Clocotici & Stan, 2000, p. 68). 

Dincolo de aceste opinii divergente, suntem de parere ca el nu trebuie neglijat, 
oferindu-ne date despre gradul de omogenitate/eterogenitate al caracteristicii vizate; 
utilitatea lui o vom vedea la calculul urmatorului indicator §i in capitolele de 
statistic^ inferential. 


6 Se folose§te s 2 cand facem referire la un enaction o 2 (sigma la patrat) cand calculam 
abaterea standard pentru intreaga populatie. Aceea§i semnificatie o au §i notatiile pentru 
abaterea standard: s §i a. 

1 In engleza: variance. 

s Programele statistice pentru prelucrarea informatizata a datelor (SPSS, Excel etc.) folosesc 
pentru calculul dispersie §i abaterii standard formule ce au la numitor n- 1. Este o corectie 
generata de considerente teoretice - vezi caseta 5.1. Prin aceste formule se obtin estimari 
ale celor doi indicatori la nivelul intregii populatii statistice, in conditiile in care valorile la 
care ne raportam apartin unui coalition extras din populatia respectiva. 
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Abaterea standard 

Abaterea standard 9 (s sau o), numitS §i abaterea medie patratica sau 
abaterea tip, 10 reprezintS rSdScina pStratS din valoarea dispersiei. 

Abatere medie patratica in cazul seriilor simple : 

5 = s[s* = 

Abaterea medie patratica in cazul seriilor de frecvente : 

5 = = 


Estimarea abaterii standard a uiteipopulatii, calculatd pe baza unui egantion: 

s = 


v = = 

Proprietdtile abaterii standard: 

- dacS la toate valorile seriei statistice se adaugS (scade) o constants c, 
abaterea standard nu se modified: daca y i = x i + c sau v, = x. - c, atunci 

= S* 

- daca toate valorile seriei statistice se inmultesc/divid cu o constants c, atunci 
§i abaterea standard se va multiplica/divide cu aceea§i valoare c: dacS 
v, = c ■x i , atunci s = c ■ s x 

- abaterea standard fatS de medie este mai micS decat abaterea standard fatS 
de oricare altS valoare (medians etc.) a distributiei. 

Mult mai des folositS in analiza seriilor statistice, abaterea medie pStraticS are 
acela§i avantaj ca §i abaterea medie liniarS, §i anume, se exprimS in aceeasi unitate 
de mSsurS ca si datele initiale pe care le studiem . De exemplu, dacS studiul se 
bazeazS pe notele unui colectiv de elevi, abaterea tip se exprimS tot in note, 


9 In engleza: standard deviation (SD). 

Abaterea standard se refera doar la abaterea medie patratica fata de medie. Putem calcula 
§i abaterea medie patratica fata de mediana, prin inlocuirea mediei cu mediana. 

10 in franceza: ecart type. 
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„permitand sa se analizeze mai cored gradul de variabilitate al grupului ” (Radu 
et.ai, 1993, p.72). 

Asemanator dispersiei, o valoarea scazuta a abaterii standard reflecta o serie 
statistic^ omogena; in caz contrar vorbim de eterogenitatea datelor. Mai mult, pe 
graficul distributiei acest indice marcheaza punctele de inflexiune ale curbei. 

Totu§i, atunci cand dorim sa comparam serii statistice cu unitati de masura 
diferite, ultimii doi indicatori nu ne mai sunt de folos. Vom folosi un alt indicator: 
coeficientul de variatie. 

COFFICIFNTIJI, DF VARIATIF, fDF VARIABIFITATF.t 

Coeficientul de variatie (V) reprezinta raportul dintre abaterea medie patratica 
§i media colectivitatii studiate. Se folose§te atunci cand dorim sa comparam gradul 
de impra§tiere al unor serii statistice exprimate in unitati de masura diferite (de 
exemplu: inaltimile a doua e§antioane de subiecti, exprimate in centimetrii, respectiv 
in inch). De asemenea, utilizam acest indicator §i cand seriile statistice au aceea§i 
unitate de masura, dar nivelul general al valorilor caracteristicii studiate este total 
diferit (de exemplu: inaltimile unor copii de la gradinita §i cele ale unor elevi de 
liceu, exprimate in centimetri). 

s 

Coeficientul de variatie: V = —100 (5.9) 

m 

Acest indicator se exprima in procente (se poate elimina inmultirea cu 100; vom 
obtine valori intre 0 §i 1) §i ne arata gradul de omogenitate/eterogenitate al colectivi¬ 
tatii statistice studiate, astfel: cu cat valoarea coeficientului de variatie este mai 
aproape de zero, cu atat variatia este mai mica, deci colectivitatea este mai omogena. 

Daca coeficientul de variatie este cuprins intre 0 §i 15%, inseamna ca 
impra§tierea datelor este foarte mica, iar media este reprezentativa, deoarece 
e§antionul masurat este omogen. Daca valoarea lui este intre 15 §i 30%, impra§tierea 
datelor este mijlocie, media fiind inca suficient de reprezentativa. Limita maxima 
admisa pentru ca un e§antion sa fie considerat omogen iar media sa fie 
reprezentativa pentru colectivitatea respective este de 35% (Novak, 1995). 

Nici acest ultim indicator nu este lipsit de contraindicatii! Cel putin doua 
atentionari trebuie facute: 

formula coeficientului de variatie este aplicabila doar in cazul 
variabilelor masurate pe scale de rapoarte, cu origine zero naturala (rar 
intalnite in psihologie §i pedagogie); 

nu oricare doua caracteristici pot fi comparate cu ajutorul coeficientului 
de variatie (de exemplu: este inutil sa comparam un equation dupa 
salariul membrilor cu alt e§antion in care avem in vedere numarul de la 
pantofi! - cf. Rotariu et.ai, 1999, p. 59). 


5.3. Indicatori ai formei distributiei 

Gradul de impra§tiere a valorilor unor serii statistice determina §i forme diferite 
ale reprezentarilor grafice ata§ate acestor distributii statistice. Pentru a reflecta forma 
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unei distribute, mai ales pentru a face comparatii intre doua sau mai multe serii, ne 
folosim de o alta categorie de indicatori, numiti indicatori ai formei. Cei doi 
indicatori folositi in statistica sociala sunt: oblicitatea §i boltirea. 

iNDICATORUL OBLICITATII IDE ASIMETRIEt 

Oblicitatea 11 a fost propusa de catre Pearson pentru aprecierea gradului de 
simterie/asimetrie a unei serii statistice. Se calculeaza cu una din formulele: 

Oblicitatea: 


q _3 -(m-M e ) 

(5.10) 

s 


m - M n 


0 = 

(5.10’) 

s 


c ,_Z (x ' -m ) 3 

(5.10”) 


ns 


Prin ridicarea abaterilor individuate la puterea a treia (formula 5.10”) se acorda 
o mai mare importanta valorilor extreme. Putem analiza astfel gradul de asimetrie al 
distributiei, altfel spus, tendinta valorilor de a se grupa spre una din cele doua 
extreme. 

In cazul distributiilor simetrice, deoarece media §i modul sunt identice, 
oblicitatea va fi 0. in cazul curbelor de distribute asimetrice, alungite spre dreapta 
sau spre stanga, oblicitatea va avea o valoarea negativa, respectiv pozitiva (vezi cap. 
6 . 2 .). 


iNDICATORUL BOLTIRII tDE EXCES. DE APLATIZAREl 

Boltirea 12 exprima inaltimea „cocoa§ei” curbei de distribute, comparativ cu cea 
normala. Ne arata masura in care o distribute este mai plata sau mai boltita. 


Boltirea: 


a = Xfc : »’) , _ 3 


ns 


(5.11) 


Pentru valori pozitive ate acestui indicator spunem ca avem o distributie 
„leptokurtica” (cu cocoa§a inalta). in celalalt sens, distributia va fi „platikurtica” (cu 
cocoajja aplatizata) - vezi figura 5.1. Valori apropiate de 0 indica o distributie 
„mezokurtica” 


11 in engleza: skewness. 

12 in engleza: kurtosis (=cocoa§a). 
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Sunt considerate distribute relativ normale cazurile in care ace§ti 
indicatori nu depa§esc ±1,96. 


5.4. Utilizarea SPSS PENTRU calcularea indicatorilor 

VARATIEI §1 AI FORMEI 

§i de aceasta data dispunem de mai multe posibilitati pentru a calcula indicatorii 
variatiei sau pe cei ai formei unei serii statistice. 

Ca §i in capitolele anteriore, prezentam pentru inceput solutia parcurgerii 
urmatoarelor comenzi: 

„ Analyze” - „Descriptive Statistics” - frequencies... ” 

Dupa ce, in fereastra de dialog pentru calculul frecventelor (vezi figura 2.1.), 
selectam variabila sau variabilele dorite, apasam butonul Statistics...” §i vom 
patrunde intr-o noua fereastra de optiuni (figura 5.1). 



Figura 5.1. Fereastra de optiuni pentru calculul unor indicatori statistici 

La rubrica „ Dispersion ” putem opta pentru calculul abaterii standard (Std. 
deviation), a variantei, a amplitudinii {Range), a valorilor minime §i maxime §i a 
erorii standard a mediei {S.E. mean). 

La rubrica distribution” se opteaza pentru calcularea oblicitatii {Skewness) 
sau boltirii {Kurtosis). 
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6 . 

DISTRIBUTIVE STATISTICE 

9 


6.1. Distributia normala 

6.2. Distribute simetrice §i asimetrice 

6.3. Distribute unimodale §i bimodale 

6.4. Valori normate (scoruri z) 

6.5. Distributia normala standardizata 


Dupa cum am aratat in capitolele anterioare (capitolul 3), prin asocierea variantelor 
(valorilor) unei variabile statistice cu frecventele (absolute sau relative) cu care acestea 
apar se obtine o DISTRIBUTIE STATISTICA. Pentru exprimarea sintetica a informatiilor 
continute de aceste §iruri de date putem calcula o multime de indicatori statistici, astfel 
incat, printr-o simpla analiza a lor sa putem spune daca distributiile statistice sunt 
simetrice sau asimetrice, unimodale sau multimodale, aplatizate sau inalte. 


6.1. Distributia normala 

Cunoscuta §i sub denumirea de curba (clopotul) lui Gauss, este o distributie 
simetrica, spre care tind toate §irurile de date obtinute in practica statistic^ §i care se 
caracterizeaza prin aceea ca valorile centrale sunt cat mai apropiate, iar de o parte §i 
de alta a lor avem un numar aproximativ egal de valori. Intr-o distributie perfect 
normala 1 media, mediana §i modul sunt identice, iar celelalte valori sunt dispuse 
perfect simetric de o parte §i de alta a acelei valori centrale. 



Figura 6.1 Curba distributiei normale 


1 Distributia perfect normala este o distributie teoretica unimodala, simetrica §i continua. 




Matematicianul K.F. Gauss a constatat urmatorul aspect: cu cat obtinem mai 
multe valori ale caracteristicii respective, cu atat curba distributie tinde spre cea 
perfect normala (sau teoretica). De altfel, acest tip de curba este considerat de cele 
mai multe ori ca un reper, normalitatea unei distributii verificandu-se fata de aceasta 
curba perfect simetrica sau, altfel spus, distributia normala reprezinta o buna aproxi- 
matie pentru distributiile multor variabile intalnite in aplicatiile statistice curente. 

Caracteristicile curbei normale §i frccvcnta cu care se face apel la aceasta in 
studiile statistice determina adesea interpretari gre§ite. Atragem atentia ca 
distributiile reale pe care le descopera psihologii in studiile lor nu au niciodata 
parametrii unei curbe normale perfecte. Acest lucru este practic imposibil daca ne 
gandim ca o curba normala are limitele deschise, mergand spre infinit, in timp ce 
distributiile reale sunt finite (Popa, 2004). 


6.2. Distributii simetrice §i asimetrice 

In analiza fenomenele psihosociale distributiile devin simetrice (vezi distributia 
normala), de cele mai multe ori, doar daca cercetatorul analizeaza un numar 
suficient de mare de cazuri, astfel incat indicatorii tendintelor centrale sa coincida, 
iar de o parte §i de alta a lor sa avem un numar aproximativ egal de valori. 



Figura 6.2. Curbe de distributie simetrice 

in foarte multe situatii, insa, variantele cu cele mai mari frecvente (valorile sau 
intervalele modale) nu coincid cu celelalte valori centrale (media sau mediana) 
inregistrandu-se o polarizarea spre dreapta sau spre stanga a acestora. Pot aparea 
urmatoarele doua situatii: 

■ m > M e > M 0 - spunem ca distributia prezinta o asimetrie de stanga 

sau pozitiva; 

■ m < M e < M 0 - spunem ca distributia prezinta o asimetrie de dreapta 

sau negativa (figura 6.3). 
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asimetrie pozitiva asimetrie negativa 



M 0 M c m X m M c M 0 X 


Figura 6.3. Curbe de distribute asimetrice 

Reamintim ca acest grad de asimetrie ne este dat §i de un indicator al formei 
distributiei §i anume, oblicitatea (vezi 5.3.). Acesta, prin valorile pozitive sau 
negative pe care le ia, ilustreaza asimetria pozitiva sau negativa. 

O asimetrie accentuata spre stanga sau spre dreapta determina aparitia unor 
tipuri particulare de distributii, cunoscute cu numele de distributii in forma de „C §i 
in forma de (figura 6.4.). De exemplu, erorile pe parcursul unui proces de 
formare a unei deprinderi sau timpul de executie al unei actiuni in procesul 
exercitiului vor inregistra valori constant descrescatoare, astfel incat, reprezentarea 
grafica a variatiei lor va avea forma literei „ ” (Radu et.al., 1993). 


distribute in forma de „ i” distribute in forma de „j” 



Figura 6.4. Curbe de distribute in forma de „ i” §i „j” 


6.3. Distributii unimodale §i bimodale 

In unele serii statistice media i§i pierde reprezentativitatea deoarece 
colectivitatea are tendinta de a se grupa in doua (sau mai multe) grupe distincte. De 
data aceasta modul este indicatorul de pozitie cel mai relevant. Din acest motiv, vom 
spune ca avem de-a face cu o DISTRIBUTIE BIMODALA (uneori chiar multimodala). 
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La randul lor, distributive bimodale pot fi simetrice sau asimetrice, negative sau 
pozitive (figura 6.5.) 


distributie bimodala 
negativa 


distributie bimodala 
simetrica 


distributie bimodala 
pozitiva 





6.5. Curbe de distributie bimodale 


Incheiem aceasta prezentare a tipurilor de distributii statistice cu precizarea ca in 
cazul curbelor simetrice se recomanda determinarea mediei §i a abaterii standard, in 
timp ce pentru seriile statistice asimetrice sunt preferate valorile medianei §i 
oblicitatii. in cazul curbelor de distributie in forma de „i\ a celor in forma de „/’ §i a 
celor bimodale este bine sa ne multumim cu un grafic §i sa determinam modul, 
respectiv frccvcntclc (Radu et.al., 1993). 


6.4. Valorile normate (standardizate) - scoruri z 

De foarte multe ori suntem pu§i in situatia de a compara valori ale unor caracte- 
ristici psihologice despre care nu cunoa§tem mare lucru. De exemplu, scorul de 17 
puncte obtinut de un subiect pe scala de introversie/extraversie nu ne indreptate§te sa 
afirmam ca este un scor mare sau mic, §i nici ca este mai bun sau mai rau decat cel 
de 9 puncte obtinut, de acela§i subiect, pe scala de stabilitate/instabilitate. 

in situatia in care nu cunoa§tem semnificatia datelor colectate in forma bruta 
putem recurge la transformarea acestora din cote brute in valori normate 
(standardizate), transformare ce se bazeaza pe proprietatile mediei §i abaterii 
standard, in cazul unei distributii normale. 

Scorul normat z (numit §i cota z sau scor z) exprima semnificatia unei anumite 
valori dintr-o distributie prin raportare la parametrii distributiei (medie §i abatere 
standard). Altfel spus, aceasta masoara distanta dintre o anumita valoare §i media 
distributiei, in abateri standard. Formula de calcul este: 

x-m 

Z= ( 6 . 1 ) 

S 

unde x reprezinta oricare dintre valorile distributiei, 

m §i s reprezinta media, respectiv abaterea standard. 
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Scorul z se nume§te §i „scor standardizat z” (nota standardizata z). Aceasta 
pentru ca poate fi utilizat pentru a compara valori care provin din distribute diferite, 
indiferent de unitatea de masura a fiecareia. 

Exemplu (apud Sava, 2004a): Un subiect a obtinut 43 de raspunsuri corecte la un 
test de acuitate vizuala (TAV) §i 18 puncte la un test de atentie concentrate (TAC). 
Daca transformam in cote z cele 43 de puncte obtinute la TAV, vom obtine valoarea 
-1,71 (§tiind ca m = 55, s = 7). Similar, daca vom transforma in cote z rezultatul 
obtinut la TAC, vom obtine -0,96 (m = 21, s = 3,11). Pe baza acestor transformari 
putem afirma ca, de§i ambele rezultate sunt sub medie, performanta la TAC este mai 
buna decat cea obtinuta la TAV. 

Utilizand proprietatile de transformare a formulei de defmitie a scorului z, 
putem calcula o anumita valoare atunci cand cunoa§tem valoarea lui z §i parametrii 
distributiei, astfel: 

X = Z- S + m (6.2) 


Proprietatile scorurilor z 

1. Media unei distributii z este intotdeauna egala cu 0. 

Pentru a explica aceasta afirmatie facem apel la una dintre proprietatile 
mediei, §i anume: scaderea unei constante la fiecare valoare determina 
scaderea mediei cu acea valoare (vezi 4.1.). Formula de calcul pentru z 
implica scaderea unei constante din fiecare valoare a distributiei. Aceasta 
inseamna ca §i media noii distributii (z) se va reduce cu constanta respectiva. 
Dar aceasta constanta este insa§i media distributiei originale, ceea ce inseamna 
ca distributia z va avea media egala cu zero, ca rezultat al diminuarii mediei 
cu ea insa§i. 

2. Abaterea standard a unei distributii z este intotdeauna 1. 

Acest fapt decurge prin efectul cumulat al proprietatilor abaterii standard (vezi 
5.2.). Prima proprietate afirma ca in cazul scaderii unei constante (in cazul 
scorurilor z, media) din valorile unei distributii, abaterea standard a acesteia 
nu se modified. A doua proprietate afirma ca in cazul impartirii valorilor unei 
distributii la o constanta, noua abatere standard este rezultatul raportului dintre 
vechea abatere standard §i constanta. Dar constanta de care vorbim este, in 
cazul distributiei z, chiar abaterea standard. Ca urmare, noua abatere standard 
este un raport dintre doua valori identice al carui rezultat, evident, este 1. 
(Popa, 1996) 
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Alte tipuri de scoruri standardizate 

Cotele z prezinta doua avantaje importante: permit compararea valorilor unei 
distribute, §i a valorilor provenite din distribute diferite, ca urmare a faptului ca se 
exprima in abateri standard de la medie. Totu§i se impune o anumita precautie in 
comparatia pe baza scorurilor z atunci cand distributiile au forme diferite §i, mai 
ales, asimetrii opuse. 

Notele z au, insa, §i unele dezavantaje: se exprima prin numere mici, cu 
zecimale, (greu de manipulat intuitiv) §i, in plus, pot lua valori negative. Aceste 
dezavantaje pot fi u§or inlaturate printr-un artificiu de calcul care sa conduca la note 
standardizate convenabile (ce corespund anumitor nevoi specifice). Mai jos sunt 
descrise cateva tipuri de note standard calculate pe baza notelor z. 

Cote T (Thurstone) - media unei distribute T este intotdeauna egala cu 50 iar 
abaterea standard cu 10. 

v — vyi 

r = 50 + 10*z r = 50 + 10* - (6.3) 

s 

Cote H (Hull) - media unei distribute H este intotdeauna egala cu 50 iar 

abaterea standard cu 14. 

X — tfl 

H =50 + 14* z 77 = 50 + 14*- (6.4) 

5 

Cote IQ (Binet) - media unei distribute IQ de acest tip este intotdeauna 
egala cu 100 iar abaterea standard cu 16. 

x — m 

IQ = 100 + 16*z 70 = 100 + 16* - (6.5) 

s 

Cote IQ (Wechsler) - media unei distribute IQ de acest tip este intotdeauna 
egala cu 100 iar abaterea standard cu 15. 

X — /77 

70 = 1OO + I5*z 70 = 100 + 15* - (6.6) 

s 
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6.5. Distributia normala standardizata 

Distributia normala in care valorile sunt exprimate in scoruri z se nume§te 
CURBA NORMALA STANDARDIZATA. Ea are toate proprietatile enuntate mai sus, 
avand insa §i parametrii oricarei distributii z: m=0 §i s=l. Valoarea 0 pentru medie a 
fost aleasa conventional pentru ca astfel distributia este simetrica in jurul lui 0. 


cote z 
cote T 
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Figura 6.6. Curba distributiei normale 


Curba normala standardizata are cateva caracteristici care sunt figurate in 
imaginea de mai sus §i pe care este important sa le retinem: 

34,13% dintre scorurile distributiei normale se afla intre medie §i o abatere 
standard deasupra mediei (z = +1). La fel pentru z = —1. 

Intre -lz §i +lz se afla aproximativ 68% dintre valorile distributiei. 
Aproximativ 96% dintre scoruri se afla intre -2z §i +2z. 

Mai mult, pe baza distributiei scorurilor z pe o curba normala standardizata 
putem preciza: 

procentajul de valori care se afla sub/peste o anumita cota z; 

procentajul de valori care se afla intre anumite cote z; ori intre medie §i o 

cota z 

cota z corespunzatoare unui anumit procentaj de valori. 

Pentru aceasta, utilizam un tabel special in care sunt trecute ariile determinate de 
curba distributiei normale ce corespund distantei dintre medie §i z abateri standard 
de la medie. Aceste cifre exprima, sub forma de probabilitati, ffecventele valorilor 
de sub curba normala z (Anexa 1). 


Aria de sub curba normala vazuta ca probabilitate 

Valorile reprezentate pe curba normala nu constituie valori reale, rezultate in 
urma unui proces de masurare. Ele reprezinta valori ipotetice, distribute astfel pe 
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baza unui model matematic (legea numerelor mari). Nimic nu ne impiedica sa 
consideram ca valorile de sub curba normala sunt rezultatul unei ipotetice extrageri 
aleatoare. Pe masura ce „extragem” mai multe valori, curba de distributie a acestora 
ia o forma care se apropie de forma curbei normale. Extragand „la infinit” valori 
aleatoare, vom obtine o distributie normala perfecta, exprimabila printr-o curba 
normala perfecta. 

Din cele spuse mai sus, rezulta faptul ca valorile din zona centrala a curbei sunt 
mai „ffecvente” (mai multe), pentru ca aparitia lor la o extragere aleatoare este mai 
„probabila”. In acela§i timp, valorile „mai putin probabile”, apar mai rar, §i 
populeaza zone din ce in ce mai extreme ale distributiei (curbei). 

Probabilitatea inseamna „frecventa relativa a aparitiei unui eveniment”. 
Subiectiv, se traduce prin „cat de siguri putem fi ca acel eveniment apare”. 

Daca probabilitatea reprezinta raportul dintre evenimentul favorabil §i toate 
evenimentele posibile, atunci valoarea ei variaza intre 0 §i 1. Ea poate fi exprimata §i 
in procente. De exemplu, probabilitatea de 0,05 corespunde unui procentaj de 
aparitie de 5% 

Utilizand simbolul p (de la „probabilitate”), spunem ca daca p<0,05 inseamna ca 
evenimentul are mai putin de 5% §anse sa apara, in conditiile unei distributii 
corespunzatoare curbei normale. 

Procentajul ariilor de sub curba normala poate fi citit, deci, §i ca probabilitatea a 
distributiei. De exemplu, probabilitatea de a avea un scor intre medie §i z=+l este de 
0,3413, ceea ce inseamna ca pentru un scor z ales la intamplare exista 34,13 §anse 
dintr-o suta ca acesta sa cada in suprafata ha§urata. (vezi figura 6.7. §i anexa 1) 



0 z 

m m+ls 


Figura 6.7. Probabilitatea de a avea un scor intre medie §i z=+l 


In acela§i mod, pe baza proprietatilor distributiei normale, vrem sa identificam 
valorile +z §i -z pentru care, intr-o distributie normala standardizata avem 95%, 
respectiv 99%, din valori. De aceste doua repere, frecvent utilizate in statistica 
inferential^, se leaga probabilitatile de 5%, respectiv 1%. 

Vom identifica aceste doua repere cu ajutorul anexei 1: 
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pentru z=l,96 aria de sub curba normala delimitata de medie §i +z este de 
0,4750; adica 47,5% din valorile z sunt cuprinse intre 0 §i 1,96 §i tot atatea 
intre -1,96 §i 0; 

pentru z=2,58 aria de sub curba normala delimitata de medie §i +z este de 
aprox. 0,4950; adica 49,5% din valorile z sunt cuprinse intre 0 §i 2,58 §i tot 
atatea intre -2,58 §i 0. 

Altfel spus: intr-o distribute normala standardizata, 95% dintre valorile z sunt 
cuprinse intre -1,96 §i 1,96; de asemenea, avem 99% dintre valorile z cuprinse intre - 
2,58 §i 2,58. Putem scrie aceste relatii sub forma: 

-1,96 <z< 1,96 

ne folosim de formula 6.1. pentru a obtine: 

-1,96 < (x - m) / s < 1,96 

(m - 1,96s) <x < (m + 1,96s) (6.7) 

Deci, pentru o distribute normala a unei variabile oarecare (nestandardizata) 
concluziile de mai sus devin (vezi figura 6.8.): 

avem 95% din valorile x cuprinse in intervalul [m-1,96s; m+l,96s]; 
avem 99% din valorile x cuprinse in intervalul [m-2,58s; m+2,58s]. 

Cu alte cuvinte, exista 5% §anse ca o valoare x luata la intamplare sa fie in afara 
intervalului [m-1,96s; m+1,96s], dupa cum exista o §ansa din 100 ca \x\ sa fie mai 
mare ca m+2,58s. 
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7. INFERENTA STATISTIC! 

9 


7.1. Delimitari conceptuale 

7.2. Probleme de estimare 

7.3. Testarea ipotezelor 

7.4. Testele parametrice t §i z. 

7.4.1. Testele t §i z pentru un e§antion. 

7.4.2. Testele t §i z pentru doua e§antioane independente 

7.4.3. Testele t §i z pentru doua e§antioane dependente 

7.5. Utilizarea SPSS pentru aplicarea testului t 

7.1. Delimitari conceptuale 

Datele obtinute in cursul unei experience, a unei observatii sistematice sau 
anchete, constituie un e§antion extras dintr-o colectivitate mai larga sau populate. 
Pe de alta parte, statistica descriptiva, reduce datele brute la cateva valori 
caracteristice: frecvente absolute sau relative, medii, abateri standard etc. Reamintim 
simbolurile pentru ace§ti parametrii, in cele doua situatii: p, a, o 2 - in cazul intregii 
colectivitati statistice; m, s, s 2 - cand ne referim la un e§antion. 



Se pune intrebarea in ce masura, plecand de la indicatorii e§antionului cercetat, 
putem formula concluzii asupra populatiei? Cu alte cuvinte, se pune intrebarea: in ce 
masura datele obtinute sunt relevante pentru populatie? Operatia prin care facem 
extrapolarea concluziilor de la coalition la populatie se numcsjtc inferenta statistica. 

Inferenta statistica se bazeaza pe teoria probabilitatilor, permitand desprinderea 
unor concluzii cu caracter probabilist. In practica, orice rezultat discutat in termeni 
de valori semnificative statistic la un prag de .05 sau .Ola corespuns unui demers 






specific statisticii inferentiale. Principalele demersuri pe care se bazeaza statistica 
inferentiala sunt estimarea parametrilor statistici §i testarea ipotezelor (Sava, 
2004a)’ 

E§antioane independente §i e§antioane perechi 

In multe cazuri psihologul este pus in situatia de a compara intre ele mediile sau 
frecventele obtinute intr-un experiment, punandu-§i, in final, intrebarea daca diferen- 
tele constatate intre grupul de control §i cel experimental sunt semnificative sau nu. 

Apar urmatoarele situatii: 

1. daca cele doua e§antioane sunt alese la intamplare pe baza caracteristicilor 
lor naturale (de exemplu, doua clase paralele) spunem ca avem e§antioane 
independente. 

2. daca cele doua e§antioane sunt in relatie unul cu celalalt spunem ca avem 
e§antioane dependente (sau e§antioane perechi). Uzual, exista trei situatii 
in care avem de a face cu e§antioane dependente: 

a. Perechile naturale: acestea nu sunt realizate de experimentator ci exista 
in mod natural. 

b. Perechile artificiale: acestea sunt realizate de catre experimentator 
pentru a egaliza cat mai mult grupele de subiecti. 

c. Masuratori repetate: reprezinta cazul cel mai des intalnit, in special in 
terapie §i recuperare. Este vorba in aceasta situatie de un singur grup de 
subiecti care vor fi testati de doua ori (inainte §i dupa introducerea 
variabilei independente). 

7.2. Probleme de estimare 

Este unanim acceptat faptul ca atunci cand calculam indicatori statistici pentru 
un e§antion facem acest lucru cu o anumita probabilitate. Altfel spus, nu reu§im sa 
determinam exact parametrii caracteristici ai intregii colectivitati. Indicatorii 
statistici calculati pentru un e§antion reprezinta estimdri ale parametrilor populatiei. 

Deoarece nu putem determina cu exactitate valoarea acestor parametri, vom 
incerca sa stabilim un interval - numit §i interval de incredere - in care se gase§te cu 
certitudine parametrul respectiv. Cu cat acest interval este mai mic, cu atat 
informatia noastra asupra adevaratei valori in populatie este mai precisa. 

7.2.1. Semnificatia unei medii 

Notand cu p valoarea medie calculata pentru intreaga populatie §i cu m media la 
nivelul e§antionului, diferenta (p - m) reprezinta eroarea pe care noi o comitem 
atunci cand in loc sa cercetam toti cei N indivizi, prelevam datele numai de la o 
subpopulatie oarecare de n indivizi. De cele mai multe ori aceasta eroare este 
diferita de 0, motiv pentru care devine necesara evaluarea ei. Insa, prin alta metoda 
decat facand diferenta (p - m), deoarece intotdeauna media populatiei ne este 
necunoscuta (daca am cunoa§te valoarea lui p nu s-ar mai pune problema estimarii) 

Semnificatia unei valori medii depinde de doi parametrii: 

volumul e§antionului (n) pe care se calculeaza media §i 
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abaterea standard (a) calculate la nivelul intregii populatii. 

Cu cat volumul e§antionului este mai mare iar dispersia populatiei mai mica, cu 
atat media calculate la nivelul e§antionului devine mai reprezentativa pentru intreaga 
colectivitate (Radu et.al., 1993). 

Pe baza acestor parametrii s-a definit eroarea standard a mediei, formula de 
calcul fiind: 



unde o reprezinta abaterea standard a variabilei .v pentru populatia totala, abatare 
care de cele mai multe ori ramane necunoscuta, fiind inlocuita in calcule cu s, 
abaterea standard a aceleia§i variabile intr-un coalition oarecare. 

Pe baza erorii standard a mediei §i considerand ca valorile medii, obtinute pe o 
multime de e§antioane consecutive extrase din aceea§i populatie, sunt distribuite tot 
dupa curba normala a lui Gauss, putem stabili, cu o probabilitate de 95% sau 99%, 
limitele intre care se gase§te adevarata valoare p a colectivitatii generale. Intervalul 
delimitat de aceste limite este chiar intervalul de incredere stabilit pentru cele doua 
praguri (niveluri) de semnificatie: 

- [m - l,96e; m + l,96e], interval de incredere lapragul de p = .05; 

- [m - 2,58e; m + 2,58e], interval de incredere la pragul de p = .01. 

Vom spune ca exista riscul ca in 5%, respectiv 1%, din cazuri adevarata medie sa 
cada in afara intervalului ales. 

7.2.2. Semnificatia frecventei (absolute sau relative) 

Analog, calculam eroarea standard a frecventei: 

(7.2) 

unde p reprezinta chiar frecventa (cu conditia ca marimea e§antionului sa fie 
n>100) iar q = 1 -f 

Intervalul de incredere va fi: 

[f- 1,96e;/+ l,96e], la pragul de p = .05; 

[f- 2,58e;/+ 2,58e], la pragul de p = .01. 

7.3. Testarea ipotezelor 

Testarea ipotezelor - demers fundamental in activitatea de cercetare §tiintifica - 
„reprezinta, alaturi de estimarea parametrilor statistici, unul dintre principalele 
aspecte ale inferentei statistice”. (Dyer, 1995, apud Sava, 2004a, p. 27) 

Ipoteza Sjtiintifica este o predictie care are capacitatea de a fi operationalizata §i 
testata pentru a oferi un raspuns problemei studiate. 

Modul de formulare a ipotezei cercetarii determina doua categorii de ipoteze: 

unidirectionale (unilaterala), atunci cand se precizeaza directia predictiei 
prin formulari de genul: „exista o corelatie pozitiva/negativa” sau „grupul A este 
mai bun/slab decat grupul B” 
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bidirectionale (bilaterala), atunci cand directia predictiei nu este 
precizata; vom avea formulari de genul: „exista o corelatie intre variabile” sau 
„exista diferente intre loturi”. 

Daca avem suficiente indicii cu privire la modul de evolutie a datelor este de 
preferat sa optam pentru formularea unor ipoteze unidirectionale, existand §anse mai 
mare ca aceasta sa fie sprijinita. (Sava, 2004a) 

Indiferent de modul de formulare, alaturi de aceasta ipoteza specified (Hs), - 
(numita §i ipoteza de cercetare, ipoteza de lucru sau ipoteza altemativa) se exprima 
§i o alta ipoteza care sa atribuie numai intamplarii, hazardului, tendintele sau 
diferentele constatate. Este vorba despre ipoteza nula (Ho) (sau ipoteza statistics) 
asupra cSreia se impun urmStoarele precizSri: 

atat ipoteza nula (Ho)cat §i ipoteza specifica (Hs) se refera la populatie, nu 
la e§antioane ca atare; 

singurul lucru ce poate fi obtinut prin testarea ipotezelor este respingerea sau 
nerespingerea ipotezei nule; 

daca ipoteza nula este respinsa, atunci ipoteza altemativa este sprijinita de 
datele obtinute, altfel spus: ipoteza specifica este acceptata; 
decizia de a respinge ipoteza nula se ia pe baza unui prag de semnificatie 
(cel mai adesea .05 sau .01). 

prag de 
semnificatie 

1 0.05 0.01 


Ho nu este respinsa Ho este respinsa 

§i se accepta Hs 


7.4. Testele parametrice t §i z. 

Pe langa studiul asocierii dintre variabile, tehnicile statistice pot fi utilizate §i 
pentru determinarea diferentelor dintre grupuri. Aceste metode se utilizeaza freevent 
in cercetarile experimentale. 

Acest capitol prezinta acele tehnici parametrice care permit evaluarea efectelor 
unei variabile independente (manipulate de cercetator) sau categoriale (varsta, sex, 
etc) asupra unei variabile dependente, in situatia in care se lucreaza cu una sau doua 
grupe de subiecti (Sava, 2004b). 

Cu ajutorul acestor teste statistice se ridica problema daca diferentele constatate 
intre grupele de subiecti sunt datorate interventiei cercetatomlui (variabilei 
independente), caracteristicilor variabilei categoriale sau dimpotriva, intamplarii. 

Exista trei tipuri de tehnici principale: 

1. Tehnici care privesc diferenta dintre un coalition §i media populatiei din care 
acesta face parte - „the one simple t Test”; 

2. Tehnici care privesc diferenta dintre doua grupe independente de subiecti - 
„the t test for independent samples”; 
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3. Tehnici care privesc diferenta dintre doua grupe dependente de subiecti - 
„the t test for correlated samples”. 

7.4.1. TEHNICILE t §1 Z PENTRU UN E§ANTION. 

In acest caz dorim sa aflam daca un e§antion de subiecti difera de o populatie 
mai mare. Sa presupunem ca un test de empatie a fost administrat pe o populatie 
mare de subiecti elevi abia intrati la liceu (N = 1000), iar media obtinuta pe intreaga 
populatie testata a fost de 76 (p). Cand s-a efectuat acela§i test pe o clasa de elevi de 
n=32 subiecti, s-a obtinut media de 81 (m) §i o estimare a abaterii standard de 9 (s). 
Se pune problema daca elevii din aceasta clasa au un nivel de empatie diferit de 
media specifica pentru clasa a IX-a. 

Pentru solutionarea acestei probleme exista doua teste statistice adecvate, §i 
anume testele z §i t. 

Vom utiliza testul z daca: 

- se cunoa§te abaterea standard a variabilei dependente la nivelul populatiei; 

- numarul de subiecti cuprin§i in e§antionul comparativ este suficient de 
mare (de regula peste 30 de subiecti). 

In situatia in care una din cele doua conditii nu este indeplinita, utilizam testul t 
(Student) pentru un e§antion. 

in problema de fata se observa ca nu putem aplica testul z de§i avem un e§antion 
comparativ destul de mare n=32 (mai mare decat 30) deoarece nu se cunoa§te 
abaterea standard a populatiei din care face parte e§antionul. 

Ca urmare, calculam testul t care valideaza sau infirma ipoteza nula potrivit 
careia, nu exista nici o diferenta intre media (m) obtinuta pe e§antionul de subiecti 
(n= 32) §i media (p) obtinuta pe populatia din care a fost extras e§antionul. 

Matematic, ipoteza nula §i cea de lucru (altemativa) se formuleaza astfel: 

Ho: p = m 
Hsp m^p 
Hs 2 : p > m ori p < m 

in cazul Hsi ipoteza altemativa precizeaza existenta unei diferente intre cele 
doua medii fara a arata directia acestei diferente. in acest caz avem de a face cu un 
test t bilateral (two-tailed test), in cazul I Is 2 ipoteza altemativa specifica directia 
diferentei intre cele doua medii - o medie este mai mica (mare) decat cealalta 
datorita unor considerente teoretice. Aceasta situatie necesita un test t unilateral 
(one-tailed). 

Cele doua tipuri de test t utilizeaza aceea§i formula, specificul unilateral vs. 
bilateral influentand doar valorile comparative prezente in tabelul lui t (anexa 2). 

Formula lui t este: 


t = 


m - // 
EE 

m 


(7.3) 


unde: m este media e§antionului 

p (miu) este media populatiei din care face parte e§antionul; 
EE m este eroarea standard a mediei e§antionului; 
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EE,„ = 


yfn 


(7.4) 


unde: s este estimarea abaterii standard a e§antionului (s=9); 
n este volumul (marimea) e§antionului (n=32). 


Calcularea testului z necesita utilizarea formulei: 

m - fj 


z — - 


EE, 


(7.6) 


unde: m este media e§antionului comparat; 
p este media populatiei; 

EEp este eroarea standard a mediei populatiei. 

EE m =-1= ( 7 - 7 ) 

v« 

unde: o (sigma) este abaterea standard a populatiei; 
n este volumul e§antionului comparat. 

Interpretarea valorii lui z obtinute se face raportand aceasta valoare la valorile 
standardizate ale lui z. Spre deosebire de testul t, care necesita consultarea tabelului t 
in vederea admiterii sau respingerii ipotezei nule, in cazul testului z, valoarea 
obtinuta se confrunta cu patru valori standardizate: 

Testul bilateral: z = 1,96 pentru un p < .05 

z = 2,58 pentru unp < .01 

Testul unilateral: z = 1,65 pentru un p < .05 
z = 2,33 pentru unp < .01 

7.4.2. TESTELE t §1 z PENTRU E§ANTIOANE INDEPENDENTE 

Testele t §i z prezentate anterior pentru a determina daca un e§antion difera de o 
populate nu se aplica prea frecvent. Mai des sunt utilizate testele t §i z pentru a 
determina daca mediile a doua e§antioane, independente sau corelate (dependente), 
difera semnificativ. Situatiile in care avem e§antioane independente sau dependente 
le-am prezentat in subcapitolul 7.1. 

Ne punem intrebarea: „Cand aplicam testul t §i cand aplicam testul z?” 
Raspunsul tine de acelea§i doua conditii prezentate anterior: cunoa§terea abaterii 
standard a celor doua e§antioane §i volumul acestora. Prima conditie este atinsa mult 
mai u§or, de aceea criteriul hotarator in alegerea tipului de test (t sau z) este volumul 
e§antionului. Exista conform teoremei limitei centrale o evolutie a distributiei 
datelor in lunctie de numarul de subiecti. Se considera §i se accepta de majoritatea 
cercetatorilor, ca un e§antion de 30 de subiecti sau mai mult are o distribute normala 
a datelor z. Un numar mai mic de 30 de subiecti determina o distribute asimetrica a 
datelor de tip t. Chiar daca se utilizeaza o impartire grosiera, s-a stabilit de catre 
cercetatori urmatoarea clauza pentru cazul a doua e§antioane: 
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• Daca n! < 30 (numarul de subiecti din prima grupa) §i n 2 < 30 (numarul de 
subiecti din a doua grupa) se aplica testul t. 

• Daca ni > 30 §i n 2 > 30 se aplica testul z. 


Testul t (Student) independent 
Testul t independent. 


t = 


m I -m n 

EE m,-m n 


(7.8) 


unde: mi §i m u reprezinta mediile celor doua e§antioane; 

EE m m reprezinta eroarea standard a diferentei dintre cele doua medii. 

Pentru calculul erorii standard a diferentei dintre medii (EE m m ) folosim 
formulele: 

Daca n! este egal n u : 


EE„ 



(7.9) 


EE... 




n,( n „ - 1 ) 


CE x n ) 2 

n„ 


(7.9') 


unde: Si 2 reprezinta dispersia primului grup (abaterea standard la patrat); Sn 2 
reprezinta dispersia celui de-al doilea grup; ni - numarul de subiecti din 
primul grup; n n - numarul de subiecti din al doilea grup. 


Daca n t este diferit de nn: 


EE„ 


^2 ( Z ^) 2 ,^2 &) 2A 

L x i -+ L x n - 

_«/_ n u 

n i + n u ~ 2 


1 1 

— + — 
n, n 


ii J 


(7.10) 


Testul z independent 

In situatia in care n r > 30 §i nn > 30 §i a doua e§antioane independente aplicam 
testul z. Formula de calcul este: 


z = 


nij - m u 



(7.12) 


Dupa cum se observa formula de calcul a lui z in aceasta situatie este identica cu 
cea a lui t independent pentru ni = n u . Spre deosebire de testul t independent, testul z 
are aceea§i formula §i in cazul in care ni ^ nn. 
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Rezultatul obtinut este comparat cu cele doua valori standardizate z (1,96 pentru 
p < .05, respectiv 2,58 pentru p < .01 pentru testul bilateral, respectiv cu 1,65 pentru 
p < .05, respectiv 2,33 pentru p < .01 pentru testul unilateral). Algoritmul rezolvarii 
problemelor care necesita testul z este asemanator cu cel prezentat in cazul lui z 
pentru un e§antion. 


7.4.3. TESTELE t §1 z PENTRU E§ANTIOANE DEPENDENTE 

Se folosesc atunci cand elementele componente ale celor doua grupe sunt in 
relatie de corespondents. 


Formula lui t dependent este: 


t = 


- m„ 
EE, 


unde: §i m u sunt mediile celor doua grupe; 

EE d este eroarea standard a diferentei (d). 
Pentru a calcula EE d utilizam una din formulele: 


EE d = 


I d~ - 




n -1 


(7.13) 


(7.14) 


unde: d este diferenta dintre pre-test §i post-test, intre pozitia unu in prima 
grupa §i pozitia unu din a doua grupa §.a.m.d.; 
n este numarul de perechi de subiecti (in cazul problemei date 12). 

sau 

EE d = j— + — - 2r 12 * — * (7.14') 

V 11 1 n n n i n ii 

unde: Si 2 §i Sn 2 sunt dispersiile celor doua grupe; 

ni §i nn sunt egale §i reprezinta numarul de perechi de subiecti; 
r 12 este coeficientul de corelatie intre datele celor doua grupe; 

Si §i Su sunt abaterile standard ale celor doua grupe. 

Testul z dependent 

Acesta poate fi utilizat in cazul e§antioanelor mai mari de 30 de subiecti fiecare. 
In aceasta situatie EE d (eroarea standard a diferentei) se calculeaza utilizand formula 
7.14' prezentata pentru t dependent care contine coeficientul de corelatie ri 2 . 

Interpretarea rezultatului obtinut se face dupa acela§i algoritm prezentat §i la 
celelalte teste z pentru un e§antion §i doua e§antioane independente. 

Consideratiile facute in cazul testului z independent cu privire la tendinta actuala 
de a inlocui testul z cu testul t chiar in cazul e§antioanelor mai mari de 30 de subiecti 
ramane valida §i pentru testele dependente. 
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7.5. Utilizarea SPSS PENTRU aplicarea testului t 


1. TESTUL t PENTRU MEDIA UNUI SINGUR E§ANTION 
Se parcurge, in bara de meniuri, traseul: 

Analyze ” - „Compare Means ” - „One-Sample T Test... ” 

Va fi afi§ata fereastra de dialog intitulata „One-Sample T Test ” (figura 7.1). 


■ 

■ One-Sample T Test 


■SHMI 







^id 


TestVariable(s): 

1 OK | 


$ Pathologic Tumor Size (c 
$ Positive Axillary Lymph N 
$ Histologic Grade [histgra 
J Estrogen Receptor Statu; 
J Progesterone Receptor J 
J Status [status] 

; f| Pathological Tumor Size 
tJ Lymph Nodes? [In_yesnc 


<^Age (years) [age] 



| Paste | 



| Reset | 




| Cancel ] 




| Help | 


^Time (months) [time] 






TestValue: 

[ Options... ] 


Figura 7.1. Fereastra pentru calculul testului t pentru media unui singur ey ant ion. 


Vom incepe prin a selecta variabila testata mutand-o din partea stanga in 
fereastra „Test Variable(s)”. in zona „Test Value ” se inscrie media populatiei, sau 
alta valoare de referinta. 

Prin apasarea butonului „Options” se va 
deschide o noua fereastra in care vom putea 
schimba valoarea pragului de semnificatie. 

Confidence Interval 95% este echivalent cu 
p=0.05 si este valoarea implicita pentru toate 
testele statistice. 

Apasam „ Continue ” iar in final „OK , \ 


One-Sample TTest: Options 


Confidence Interval: [95_] % 

Missing Values 

(•) Exclude cases analysis by analysis 
O Exclude cases listwise 



2. TESTUL t PENTRU E§ANTIOANE INDEPENDENTE 
Se parcurge, in bara de meniuri, traseul: 

Analyze” - „Compare Means” - „One-Sample T Test... ” 

Va fi afi§ata fereastra de dialog intitulata „One-Sample T Test ” (figura 7.1). 
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Figura 7.2. Fereastra pentru calculul testului tpentru e§antioane independente. 

§i de data aceasta vom incepe prin a selecta variabila testata mutand-o din partea 
stanga in fereastra „Test Variable(s)”. 

Diferenta apare in zona „ Grouping 
Variable ”, acolo unde va trebui sa 
definim variabila independents (grup), 
cea care face diferenta intre e§antioanele 
independente. 

Prin apasarea butonului ..Define 
Groups ” se va deschide o noua fereastra 
in care vom specifica valorile care 
defmesc cele doua grupuri. 

Apasam „Continue”, iar daca toate campurile le-am completat corect se va 
activa butonul „OtC\ 



* 


3. Testul t pentru diferenta dintre mediile a doua e§antioane 

DEPENDENTE (PERECHl) 

Se parcurge, in bara de meniuri, traseul: 

Analyze” - „Compare Means ” - ^Paired-Sample T Test... ” 

Va fi afi§ata fereastra de dialog intitulata paired -Sample T Test ” (figura 7.3). 
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Figura 7.3. Fereastra pentru calculul testului t pentru egantioane perechi. 


Se selecteaza cu cate un clic de mouse, pe rand, fiecare dintre cele doua 
variabile. Astfel se constituie perechea de variabile in zona „ Current selection”. O 
data constituita, perechea de variabile se trece in lista paired Variables ” cu butonul 
de transfer (►). Pot fi create mai 


multe perechi de variabile §i 
prelucrate simultan. 

Caseta „ Options ” permite 
alegerea pragului de semnificatie, 
daca dorim schimbarea celui 
implicit (p=0.05). 


Paired-Samples T Test: Options 


Confidence Interval: 

Missing Values 

(Si Exclude cases analysis by analysis 
O Exclude cases listwise 


a 


Continue 


Cancel 


Help 
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8 . 

CORELATIE §1 REGRESIE 


8.1. Notiunea de covarianta 

8.2. Coeficientii de corelatie 

8.2.1. Clasificarea coeficientilor de corelatie 

8.2.2. Formula coeficientului de corelatie liniara simpla (Bravais-Pearson) 

8.2.3. Reprezentarea grafica a corelatiei. Liniaritatea relatiei. 

8.2.4. Interpretarea coeficientului de corelatie. Marimea efectului. 

8.3. Coeficienti de corelatie parametrici 

8.3.1. Coeficientul de corelatie Pearson r 

8.3.2. Coeficientul r bis 

8.4. Coeficienti de corelatie neparametrici: 

8.4.1. Coeficientul de corelatie a rangurilor Spearman p 

8.5. Regresia simpla liniara. 

8.6. Utilizarea SPSS pentru determinarea coeficientilor de corelatie 


Adesea, in practica sau cercetarea psihologica, pe langa aplicarea testelor de 
semnificatie prezentate in capitolul anterior (prin care verificam semnificatia 
diferentei intre doua medii ale aceleia§i variabile, masurate in doua situatii diferite), 
suntem interesati de gradul de asociere dintre doua variabile masurate pe acela§i 
grup de subiecti. De data aceasta vom opera cu mai mult de o singura variabila. 
Vorbim astfel de o statistica bivariata, axata pe indicatori descriptivi de asociere sau 
de relationare, intele§i prin termenii de covarianta §i independents. 


8.1. Notiunea de covarianta 

Covarianta este rezultatul variatiei concomitente a valorilor care apartin de 
doua variabile. Covarianta ne indica existenta unei legaturi intre variatia valorilor 
unei variabile in raport cu cealalta variabila. De exemplu (adaptare dupa Radu et.al., 
1993, p.103), observand notele obtinute de aceia§i elevi la matematica §i la fizica, 
constatam ca ele covariaza, adica sunt asemanatoare: elevii cu performante notabile 
la matematica au note mari §i la fizica, §i reciproc. In realitate, situatiile de acest gen 
sunt foarte multe: nivelul ridicat al pregatirii §colare covariaza cu numarul de carti 
citite intr-o perioada de timp; performantele ridicate in conducerea autovehiculului 
sunt asociate cu rezultatele ridicate la testele de atentie etc. 

Conceptul de independents se opune celui de covarianta. El este caracteristic 
unei situatii de neasociere intre doua variabile. Independent se refera la relatia 
dintre doua evenimente, variabile sau seturi de date, astfel incat nici una nu poate fi 




influentatS de alta §i schimbSrile care pot fi realizate la nivelul uneia sunt posibile 
fSrS sS o influenteze pe cealaltS (English & English, 1958, apud Pitariu, 1991). 
Desigur, independenta trebuie luatS in sens relativ. De exemplu, nu putem considera 
ca asociere relatia dintre inteligentS §i numSrul copacilor dintr-o pSdure. 

Covariatia dintre douS variabile poate fi evidentiatS prin trei elemente 
descriptive (Sava, 2004): 

calcularea coeficientilor de corelatie, 
reprezentarea graficS a norului de puncte, 
realizarea de tabele de contingents (de asociere). 


8.2. COEFICIENTII DE CORELATIE 

Coeficientii de corelatie sunt indicatori descriptivi ce aratS gradul de covariatie 
dintre doua variabile. Ei reflects gradul de variatie concomitentS dintre doua §i 
numai doua variabile: o singura variabilS independenta (X) §i o singura variabilS 
dependents ( Y ). Cand cele doua variabile covariazS in acela§i sens, vorbim despre o 
corelatie pozitiva (ex. cu cat timpul alocat pregStirii examenului de statistics este 
mai mare, cu atat nota obtinutS la evaluarea finals este mai bunS). DacS asocierea 
este in directii opuse (in timp ce o variabilS create, cealaltS scade), discutSm despre o 
corelatie negativa. (ex. performanta unui angajat la un test de atentie concentratS 
este cu atat mai bunS cu cat numSrul de erori este mai mic). 

Se impune o precizare. Spre deosebire de experiment, care dezvSluie relatii 
cauzS-efect, studiul de corelatie nu oferS nemijlocit o mSsurS a cauzalitStii, ci pur §i 
simplu a modului de asociere. Coeficientul de corelatie este un index al 
prezentei/absentei unei relatii intre douS variabile §i nu un index al unei relatii 
cauzale. Corelatia insS este implicatS in predictie. O corelatie semnificativS (mare) 
intre X §i Y ne poate spune, cu diferite grade de precizie cS prin cunoa§terea valorii 
uneia dintre cele douS variabile, putem sS estimSm valoarea celeilalte (ex. dacS 
scorurile la unele scale din CPI (Y) sunt ridicate, atunci §i performantele manageriale 
(X) se poate estima cS vor fi ridicate; conditia este ca intre cele douS variabile sS 
existe o corelatie semnificativS.) 

8.2.1. Clasificarea coeficientilor de corelatie 

Coeficientii de corelatie se impart in douS mari categorii: 

- coeficienti de corelatie parametrici: coeficientul Bravais-Pearson (r), 

biserial (r bis ), punct biserial (r pbis ); 

- coeficienti de corelatie neparametrici: coeficientul de corelatie a 

rangurilor Spearman (p), coeficientul Kendall (x), . 

In functie de tipul datelor colectate §i de liniaritatea/monotonia relatiei dintre 
cele douS variabile, tratatele de statistics prezintS o multitudine de coeficienti de 
corelatie. Ne vom limita in aceastS lucrare doar la prezentarea celor care sunt 
utilizati mai des de cStre psihologi §i pedagogi. 
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Tabelul 8.1 Utilizarea coeficientilor de corelatie in functie de tipul variabilelor 1 . 



Variabila independenta x 

Nominala 

dihotomica 

Nominala cu 
mai mult de 
doua valori 

Ordinala 

Numerica 

(de interval 
sau de raport) 

Variabila dependenta 

y 

Nominala dihotomica 

r, X 2 , 

Ttetrahoric 

X 2 , x, C, V 

Kendall x 

1*? Tbis? l*pbis 

Nominala cu mai mult 
de doua valori 


X 2 , X, C, V 

Chi patrat y w 2 , 
X 

xU 

Ordinala 



Spearman p 
Kendall x 

Spearman p 
Kendall x 

Numerica (de interval 
sau de raport) 




Person r 


8.2.2. Formula de calcul a coeficientului de corelatie liniara sirnpla 

Dupa cum §tim, coeficientii de corelatie ne arata gradul de covariatie dintre doua 
serii statistice. Covarianta dintre variabila X §i variabila Y ne este data de formula: 

Ya x -y 


cow„ = 


( 8 . 1 ) 


In aceasta formula, x §i y sunt valorile-pereche ale celor doua variabile, iar n 
reprezinta volumul e§antionului. De§i reflects cu succes asocierea sau relationarea 
dintre cele doua variabile, calculul covariantei intampina o problema: produsul de la 
numarator are sens doar daca cele doua variabile sunt exprimate in aceea§i unitate de 
masura. De exemplu (Popa, 2009), este evident faptul ca, nu putem aplica formula 
de mai sus pentru a studia covarianta dintre inaltime §i greutate, deoarece este dificil 
sa intelegem rezultatul unui produs dintre unitati de masura diferite (kg pentru greu¬ 
tate §i cm pentru lungime). Acest inconvenient a fost eliminat prin transformarea 
valorilor celor doua variabile in cote z. Astfel, produsul scorurilor standard z x §i z y 
nu mai are legatura cu unitatile de masura ale lui X §i Y. Mai mult, aceasta 
standardizare (i) va egaliza influenta variabilelor asupra gradului de asociere dintre 
ele (de exemplu [Sava, 2004], daca vom calcula covarianta dintre venit §i numarul 
anilor de $ coal a absolviti, prima variabila, avand o amplitudine mai mare, va 
contribui mai mult la rezultatul final; venitul poate varia intre 0 §i 10.000, in timp ce 
numarul anilor de §coala absolviti poate fi de maxim 25) §i (ii) va permite 
compararea gradului de asociere dintre doua variabile cu asocierea dintre alte doua 
variabile (de exemplu, care asociere este mai putemica, intre inteligenta baietilor §i a 
tatilor sau intre frumusetea fetelor §i a mamelor?!). 

In consecinta, corelatia este o forma standardizata a covariantei, eliminand 
problema masurarii datelor prin scale diferite. Formula de calcul a corelatiei este: 


-z. 


( 8 . 2 ) 


Literele grece^ti din tabel au urmatoarele pronuntii: x = chi patrat, p=rho, x=tau, /.^lamda. 
(p=phi. 


71 



unde z x §i z y scorurile z ale variabilelor X §i Y, iar n marimea e§antionului. 

r exprima intensitatea relatiei liniare dintre valorile a doua variabile §i este 
cunoscut sub numele de coeficient de corelatie liniara simpla. ll mai gasim sub 
denumirile: coeficient de corelatie al „moment-produsului”, coeficient de corelatie 
Bravais-Pearson 2 3 sau chiar simplu „Pearson r”. 

Coeficientul de corelatie Bravais-Pearson are cea mai mare frecventa de utilizare 
in psihologie, insa -atentie!- se folose§te doar cand relatia dintre variabilele supuse 
calculului de corelatie este liniara (vezi 8.2.3.), iar cele doua variabile sunt 
exprimate numeric (in putine cazuri, acceptam §i variabile masurate prin scale 
nominale dihotomice). 

Valorile lui r sunt cuprinse intre -1 §i +1, trecand prin 0 care indica absenta 
corelatiei. Daca r este pozitiv, atunci vorbim de o corelatie directa, pozitiva. In cazul 
acesta, daca una din variabile X create, atunci §i cealalta variabila Y va avea tendinta 
de a create. 

Cand coeficientul de corelatie este nul, se spune doar ca variabilele X §i Y sunt 
necorelate, eventual independente. 

Daca r este negativ, atunci Y va avea tendinta de a varia in medie sens invers lui 
X. In acest caz corelatie este negativa, inversa. 

Valorile r = -1 §i r = +1 ne indica existenta unei relatii perfecte intre variabile. 

_A _0_+1_ 

Asociere negativa Lipsa de asociere Asociere pozitiva 

(inversa) (directa) 

Figura 8.1. Valorile coeficientilor de corelatie 

Formula coeficientului de corelatiei ia in considerare, de fiecare data, cate doua 
variabile statistice. De multe ori, in studiile psihosociale ne intereseaza asocierea 
dintre mai multe variabile. Spre exemplu, daca avem trei variabile X, Z, §i Z vom 
calcula succesiv r xy , r xz §i r yz . Cu aceste valori putem intocmi o matrice a 
coeficientilor de corelatie utilizata in analiza factoriala. 

8.2.3. Reprezentarea grafica a corelatiei. Liniaritatea relatiei. 

In cercetarea psihologica a corelatiei, analiza norului de puncte' este de mare 
importanta, oferind numeroase explicatii suplimentare fata de un simplu coeficient 
de corelatie. Astfel, ni se ofera detalii referitor la forma relatiei dintre doua variabile 
(liniara sau neliniara - figura 8.2.), direcfia (pozitiva, negativa sau absenta unei 
asocieri- figura 8.3.), intensitatea relatiei dintre doua variabile (putemica, medie sau 


2 La sfar§itul secolului al XlX-lea, statisticianul englez Karl Pearson (1857-1936) dezvolta, 
prin utilizarea datelor cuprinse in incercarile lui Bravais, forma finala a coeficientului de 
corelatie prin momentul produselor. Pearson fost elev al celebrului matematician Francis 
Galton (1822-1911), cel care a introdus tehnica corelatiei in biologie §i psihologie. 
(Clocotici & Stan, 2001) 

3 in engleza scatterplot. 
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scazuta). O incursiune in domeniul reprezentarii grafice a coeficientului de corelatie 
o gasim deci utila. 

Examinarea norului de puncte, care reprezinta proiectia fiecarui subiect intr-un 
spatiu bidimensional, se poate afirma ca este un pas semnificativ in studiul corelatiei 
dintre doua variabile. El ofera, in final, indicii asupra tipului de coeficient de 
corelatie pe care dorim sa-1 calculam. 

8.2.4. Interpretarea coeficientului de corelatie. Marimea efectului. 

Interpretarea increderii lui r 

Criteriul dupa care poate fi discutata semnificatia lui r presupune consultarea 
unei tabele special construite. Prin acest procedeu se poate respinge ipoteza nula 
conform careia nu exista o relatie adevarata (semnificativa), intre variabile, iar 
eventualele asocieri se datoreaza intamplarii. Daca o relatie este semnificativa din 
punct de vedere statistic, adica este de incredere, inseamna ca vom obtine rezultate 
similare daca s-ar reface experimentul. 

In utilizarea tabelului lui r putem alege diferite praguri de semnificatie. Exista o 
intelegere la nivelul comunitatii §tiintifice intemationale cum ca pragul minim 
acceptat pentru a considera o relatie semnificativa statistic este 0,05. Aceste valori 
pot fi insa §i mai mici. 

Pentru aflarea semnificatiei unui coeficient de corelatie este necesara 
parcurgerea urmatorilor pa§i: 

1. Se alege nivelul de semnificatie dorit, sa zicem de 0,05. 

2. Se stabile§te tipul de relatie intre variabile: bilaterala (two-tailed), respectiv 
unilaterala (one-tailed). 

3. Se citcsjtc din tabel (Anexa 3) valoarea lui r pentru coloana corespunzatoare 
numarului de grade de libertate (notat cu df). Acestea sunt pentru r de df=N- 
2 stabilindu-se in functie de numarul de subiecti N validati. 

4. Daca valoarea lui r obtinuta in urma calcularii sale o depa§e§te pe cea din 
tabel, atunci aceasta este semnificativa la pragul de semnificatie ales, in 
cazul nostru de 0,05 (notat §i cu .05) §i numarul de grade de libertate 
specificat. 

Interpretarea corelatiei din perspectiva semnificatiei 

Statistica poate raspunde la doua intrebari privind datele pe care le avem: Sunt 
autentice relatiile (efectele) descoperite? Ce semnificatie au acestea? 

Cel mai utilizat criteriu pentru interpretarea semnificatiei coeficientului de 
corelatie este coeficientul de determinare (r 2 - r patrat). Acest criteriu nu are 
intotdeauna insemnatate din cauza influentei importante pe care o are marimea 
lotului in determinarea coeficientului de corelatie. El trebuie analizat cu grija in 
cazurile in care exista un numar relativ mic de subiecti (sub 20). De asemenea, 
coeficientul de determinare poate fi aplicat doar daca am obtinut in prealabil un r 
semnificativ. 

Prin intermediul lui r patrat se determina partea de asociere comuna a factorilor 
care influenteaza cele doua variabile. Cu alte cuvinte, coeficientul de determinare 
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indica partea din dispersia totala a masurarii unei variabile care poate fi explicate sau 
justificata de dispersia valorilor din cealalta variabila. 

De exemplu, daca intr-un studiu corelatia gasita a fost de 0,83, atunci putem 
afirma ca r 2 = (r) 2 (coeficientul de corelatie la patrat) este de 0,69. Uzual coeficientul 
de determinare se inmulte§te cu 100 §i exprimarea se transforma in procente din 
dispersie (69%). 


8.3. COEFICIENTI DE CORELATIE PARAMETRICI 

Pentru a calcula coeficientii de corelatie parametrici, variabilele studiate trebuie 
sa indeplineasca urmatoarele conditii: 

- sa fie variabile numerice (exprimate pe scale de intervale sau de rapoarte), 

- variabila supusa studiului sa aiba o distribute cat mai apropiata de cea 
normala §i un grad ridicat de omogenitate; 

- distributia comuna a variabilelor sa nu prezinte valori extreme (outliers). 
Verificarea acestor conditii este o etapa preliminary in orice analiza bazata pe 

studiul corelational. Este important de retinut ca, inainte de a calcula unul sau altul 
dintre coeficienti, trebuie sa verificam valorile mediei, abaterii standard §i a 
indicatorilor de asimetrie, sa analizam norul de puncte ce reprezinta grafic asocierea 
dintre variabile, iar, daca este cazul, sa eliminam valorile extreme 4 sau sa asiguram 
conditia de homoscedasticitate 5 * . 


8.3.1. Coeficientul de corelatie Pearson r. 

Atunci cand variabilele sunt prezentate sub forma de scoruri brute, formula de 
calcul a lui Pearson r, este urmatoarea: 

X(x, - m r )( y, - m v ) 

r — ' y> = (8.3) 

yjZ(x, - m x) 2 ■ Ziy, - m y) 7 


Aceasta este o formula derivata din (8.2), in care s-au inlocuit expresiile pentru 
scorurile z x §i z y . Putem sa simplificam calculele utilizand o formula asemanatoare, 
care se bazeaza pe calcule mai u§or de realizat: 


r = ■ 


S(x ; -m x )(y, -m ) 


n ■ .S' 


(8.4) 


8.3.2. Coeficientul r biserial 

Coeficientul r biserial il gasim notat cu simbolul r b sau r bis . Este utilizat cand 
doua variabile corelabile sunt continue, dar una din ele a fost arbitrar dihotomizata . 
Exista exemple numeroase cand intr-o cercetare corelationala este mai avantajos sa 


4 Le mai putem spune valori neobi^nuite sau influente; in engleza se numesc „outliers 

5 Este o proprietate a relatiei liniare dintre doua variabile exprimata prin omogenitatea 

norului de puncte ce reprezinta distributia comuna a variabilelor. 
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impartim distributia scorurilor in doua clase, nu neaparat egale. Uneori chiar suntem 
constran§i de imprejurari sa facem acest lucru, neavand la dispozitie decat o singura 
variabila, cum ar fi de pilda situatia de „acceptat”/„respins” la un test de cuno§tinte 
profesionale; aceasta dihotomie o mai putem realiza in functie de comportamentul 
„extravertif 7„intravertif’, de locusul controlului „intem”/„extem” etc. 

Formula coeficientului r biserial, utilizat cand avem de-a face cu variabile 
dihotomice sau organizate pe mai multe clase, este urmatoarea: 

pq_ 
y 


m p -m q 


'bis 


(8.5) 


unde: m p = media scorurilor celor declarati „acceptati” la testul profesional; 
m q = media grupului celor „respin§i” la testul profesional; 
p = proportia in grupul celor „acceptati”; q = (\-p) proportia celor „respin§i” 
o t = abaterea standard pe lotul total; 

y = ordonata unitatii de arie a curbei normale la punctul care imparte aria 
totala in doua segmente (p+q=l) - valoarea pq/y se extrage din tabele. 


OBSERVAT1E: In cazul coeficientului de corelatie biserial numarul de subiecti 
cuprin§i in e§antion trebuie sa fie mai mare de 50. 


8.4. COEFICIENTI DE CORELATIE NEPARAMETRICI 

Coeficientul de corelatie Bravais-Pearson nu poate fi utilizat in orice situatie. 
Apelul in orice conditii la acesta este o eroare pe care o fac multi psihologi cand vor 
sa faca un studiu corelational. Un criteriu important in alegerea metodei adoptate in 
calculul coeficientului de corelatie este analiza atenta a setului de date cu care se 
opereaza. In continuare vom mentiona cateva situatii particulare in care sunt folositi 
alti coeficienti de corelatie decat r. 


8.4.1. Coeficientul de corelatie a rangurilor rho sau p (Spearman) 

Cand o scala (ex. variabila X) este o masura ordinala §i cand a doua scala (ex. Y) 
este fie o scala ordinala, fie una de raport sau de interval, nu se poate calcula 
coeficientul de corelatie r a lui Bravais-Pearson. 

Coeficientul de corelatie p se bazeaza pe calculul diferentei de ranguri obtinute 
de subiecti la cele doua variabile. Formula de calcul este urmatoarea: 


6VZ) 2 

p = 1 -^- 

n{n - 1) 


(8.7) 


unde D reprezinta diferenta de rang obtinuta pe cele doua variabile, pentru fiecare 
observatie in parte. 

Coeficientul de corelatie a rangurilor Spearman p are acela§i domeniu de variatie (- 
1/+1) §i se interpreteaza in acela§i mod ca §i coeficientul de corelatie pentru date 
parametrice Pearson r. 
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8 . 5 . REGRESIA SIMPLA LINIARA 

Intr-un sens larg, regresia este o analizS a relatiei existente intre variabile. O 
ecuatie de regresie simplS contine o variabilS independents (X) §i o variabilS 
dependents (Y). O ecuatie care contine mai multe variabile independente este o 
ecuatie de regresie multipla (R). DacS procedSm la reprezentarea graficS a corelatiei 
dintre douS variabile distribuite liniar, observSm cS norul de puncte poate fi divizat 
de o dreaptS, linia de regresie sau „linia celei mai bune predictii”. Prin intermediul 
acestei linii, pot fi fScute predictii asupra cSrei valori a lui X ii va corespunde o 
valoare a lui Y (§i invers). Utilitatea practicS cea mai importantS a folosirii ecuatiei 
de regresie in testarea psihologicS, este sS facS o predictie a unui scor sau altS 
variabilS, cand este cunoscutS o variabilS. Cu cat corelatia dintre douS variabile este 
mai mare, cu atat predictia va fi mai precisS. (Pitariu, 1991) 

Formula ecuatiei de predictie este: 

Y = a + bX (8.8) 

in formula de mai sus, a §i b sunt coeficientii de regresie', b se referS la panta 
liniei de regresie iar a este o constants. Ambii coeficienti se pot determina pe baza 
unor calcule algebrice din datele brute. 
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8.6. Utilizarea SPSS PENTRU calcularea coeficientilor 

DE CORELATIE 

Se parcurge, in bara de meniuri, traseul: 

Analyze” - „Cor elate” - ^Bivariate... ” 

Va fi afi§ata fereastra de dialog intitulata ^Bivariate Correlations ” (figura 8.5). 



Figura 8.5. Fereastra pentru calculul coeficientilor de corelatie. 

Vom incepe prin a selecta variabilele supuse corelatiei mutandu-le din partea 
stanga in fereastra „Variables:”. Pot fi selectate mai mult de doua variabile, situatie 
in care vom obtine coeficientii de corelatie pentru toate perechile posibile de cate 
doua variabile. De exemplu, daca selectam trei variabile X, Y §i Z, vom obtine r xy , 

Ixz §1 lyz* 

In zona „ Correlation Coefficients”, in mod implicit va fi selectat coeficientul 
Pearson (r). Daca variabilele nu sunt distribute normal sau daca sunt masurate pe 
scale ordinale (neparametrice), vom selecta fie coeficientul de corelatie a lui Kendal 
(x), fie pe cel al lui Spearman (p). 

La rubrica „Test of Significance”, tipul implicit de testare a ipotezei este bilateral 
(„Two-tailed”), dar se poate alege unilateral („i One-tailed”). 

ff'lag significant correlations”, are ca efect marcarea cu un asterisc a 
coeficientilor semnificativi la p=0.05 §i cu doua asteriscuri a celor semnificativi la 
p=0.01. Acest lucru este util atunci cand matricea de corelatie este mare, pentru a 
scoate in evidenta valorile semnificative ale lui r. 

Apasand butonul „ Options ...” putem solicita calcularea altor indicatori statistici 
ai variabilelor respective (de exemplu: media §i abaterea standard). 
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Reprezentarea grafica a corelatiei cu ajutorul SPSS 

(SCATTERPLOT) 

Pentru a vizualiza norul de puncte, implicit pentru a stabili caracterul §i 
intensitatea corelatiei dintre cele doua variabile folosim o procedure grafica 
specifica, numita scatterplot. 

In bara de meniuri a programului SPSS vom parcurge traseul: 

„Graphs ” - ^Legacy Dialogs” - „Scatter/Dot. 

Se va deschide o fereastra noua din care selectam Simple Scatter 



Figura 8.6. Fereastra in care selectam modalitatea de reprezentare scatterplot. 
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